一種基于上下文的抽象樣本信息檢索系統(tǒng)及其抽象樣本特征化表示方法

基本信息

申請(qǐng)?zhí)?/td> CN201610369833.4 申請(qǐng)日 -
公開(公告)號(hào) CN106095791A 公開(公告)日 2016-11-09
申請(qǐng)公布號(hào) CN106095791A 申請(qǐng)公布日 2016-11-09
分類號(hào) G06F17/30(2006.01)I;G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 吳琳;韓廣;袁鑫攀;李亞楠 申請(qǐng)(專利權(quán))人 長(zhǎng)源動(dòng)力(山東)智能科技有限公司
代理機(jī)構(gòu) 長(zhǎng)沙市護(hù)航專利代理事務(wù)所(特殊普通合伙) 代理人 長(zhǎng)源動(dòng)力(山東)智能科技有限公司;長(zhǎng)源動(dòng)力(北京)科技有限公司
地址 250300 山東省濟(jì)南市長(zhǎng)清區(qū)崮云湖街道辦事處丹鳳小區(qū)南區(qū)1區(qū)1號(hào)樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種基于上下文的抽象樣本信息檢索系統(tǒng)。該系統(tǒng)中抽象樣本特征化表示方法利用Word2vector提取詞義特征,獲得抽象詞的詞向量;而后,對(duì)抽象詞的詞向量進(jìn)行“最優(yōu)適應(yīng)度劃分”的聚類,并根據(jù)聚類結(jié)果將抽象詞替代表示為聚類質(zhì)心;最后,根據(jù)質(zhì)心及其所代表的抽象詞的詞頻,構(gòu)成詞向量聚類質(zhì)心頻率模型(ST?IDF),用于特征化表示抽象樣本。本發(fā)明降低了聚類及適應(yīng)度計(jì)算的執(zhí)行次數(shù),提高了抽象樣本相似性分析的性能,提升了樣本分類準(zhǔn)確率。