一種基于上下文的抽象樣本信息檢索系統(tǒng)

基本信息

申請?zhí)?/td> CN201610369833.4 申請日 -
公開(公告)號 CN106095791B 公開(公告)日 2019-08-09
申請公布號 CN106095791B 申請公布日 2019-08-09
分類號 G06F16/332;G06F16/35;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 吳琳;韓廣;袁鑫攀;李亞楠 申請(專利權(quán))人 長源動力(山東)智能科技有限公司
代理機構(gòu) 北京恒泰銘睿知識產(chǎn)權(quán)代理有限公司 代理人 長源動力(北京)科技有限公司
地址 100095 北京市海淀區(qū)高里掌路1號院2號樓2層201-004
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種基于上下文的抽象樣本信息檢索系統(tǒng)。該系統(tǒng)中抽象樣本特征化表示方法利用Word2vector提取詞義特征,獲得抽象詞的詞向量;而后,對抽象詞的詞向量進行“最優(yōu)適應度劃分”的聚類,并根據(jù)聚類結(jié)果將抽象詞替代表示為聚類質(zhì)心;最后,根據(jù)質(zhì)心及其所代表的抽象詞的詞頻,構(gòu)成詞向量聚類質(zhì)心頻率模型(ST?IDF),用于特征化表示抽象樣本。本發(fā)明降低了聚類及適應度計算的執(zhí)行次數(shù),提高了抽象樣本相似性分析的性能,提升了樣本分類準確率。