私募產(chǎn)品的數(shù)據(jù)入庫(kù)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202111046054.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113868371A 公開(kāi)(公告)日 2021-12-31
申請(qǐng)公布號(hào) CN113868371A 申請(qǐng)公布日 2021-12-31
分類(lèi)號(hào) G06F16/33(2019.01)I;G06F40/289(2020.01)I;G06K9/62(2006.01)I;G06Q40/06(2012.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 付俊杰 申請(qǐng)(專(zhuān)利權(quán))人 深圳市金斧子網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 深圳市特訊知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 孟智廣
地址 518000廣東省深圳市南山區(qū)粵海街道科技園社區(qū)科苑路15號(hào)科興科學(xué)園B棟B3-1106
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及數(shù)據(jù)查重領(lǐng)域,公開(kāi)了一種私募產(chǎn)品的數(shù)據(jù)入庫(kù)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。該方法包括:獲取待分析的私募產(chǎn)品特征集,其中,私募產(chǎn)品特征集包括:產(chǎn)品名稱(chēng)、產(chǎn)品經(jīng)理名稱(chēng)、產(chǎn)品公司名稱(chēng);根據(jù)預(yù)置拆分提取算法,對(duì)產(chǎn)品名稱(chēng)進(jìn)行拆解處理,得到拆分關(guān)鍵詞集;讀取拆分關(guān)鍵詞集中的拆分關(guān)鍵詞,根據(jù)預(yù)置組合框架,將產(chǎn)品經(jīng)理名稱(chēng)、產(chǎn)品公司名稱(chēng)、拆分關(guān)鍵詞進(jìn)行連接組合處理,得到檢索詞;根據(jù)預(yù)置向量轉(zhuǎn)換算法,將檢索詞進(jìn)行向量轉(zhuǎn)換處理,得到檢索向量,以及根據(jù)預(yù)置權(quán)重賦值算法,對(duì)檢索向量進(jìn)行權(quán)重控制處理,得到檢測(cè)權(quán)重向量;根據(jù)預(yù)置相似度算法,計(jì)算檢測(cè)權(quán)重向量與私募特征集數(shù)據(jù)庫(kù)中私募特征集對(duì)應(yīng)特征目標(biāo)向量之間的相似度,得到相似度集;判斷相似度集中的相似度是否均小于預(yù)置相似度閾值;若不均小于,則將私募產(chǎn)品特征集添加至私募特征集數(shù)據(jù)庫(kù)中。