一種基于上下文的抽象樣本信息檢索系統(tǒng)
基本信息
申請?zhí)?/td> | CN201610369833.4 | 申請日 | - |
公開(公告)號 | CN106095791B | 公開(公告)日 | 2019-08-09 |
申請公布號 | CN106095791B | 申請公布日 | 2019-08-09 |
分類號 | G06F16/332;G06F16/35;G06K9/62 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 吳琳;韓廣;袁鑫攀;李亞楠 | 申請(專利權(quán))人 | 長源動力(山東)智能科技有限公司 |
代理機構(gòu) | 北京恒泰銘睿知識產(chǎn)權(quán)代理有限公司 | 代理人 | 長源動力(北京)科技有限公司 |
地址 | 100095 北京市海淀區(qū)高里掌路1號院2號樓2層201-004 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出了一種基于上下文的抽象樣本信息檢索系統(tǒng)。該系統(tǒng)中抽象樣本特征化表示方法利用Word2vector提取詞義特征,獲得抽象詞的詞向量;而后,對抽象詞的詞向量進行“最優(yōu)適應度劃分”的聚類,并根據(jù)聚類結(jié)果將抽象詞替代表示為聚類質(zhì)心;最后,根據(jù)質(zhì)心及其所代表的抽象詞的詞頻,構(gòu)成詞向量聚類質(zhì)心頻率模型(ST?IDF),用于特征化表示抽象樣本。本發(fā)明降低了聚類及適應度計算的執(zhí)行次數(shù),提高了抽象樣本相似性分析的性能,提升了樣本分類準確率。 |
