一種基于上下文的抽象樣本信息檢索系統(tǒng)及其抽象樣本特征化表示方法
基本信息
申請(qǐng)?zhí)?/td> | CN201610369833.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN106095791A | 公開(公告)日 | 2016-11-09 |
申請(qǐng)公布號(hào) | CN106095791A | 申請(qǐng)公布日 | 2016-11-09 |
分類號(hào) | G06F17/30(2006.01)I;G06K9/62(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 吳琳;韓廣;袁鑫攀;李亞楠 | 申請(qǐng)(專利權(quán))人 | 長(zhǎng)源動(dòng)力(山東)智能科技有限公司 |
代理機(jī)構(gòu) | 長(zhǎng)沙市護(hù)航專利代理事務(wù)所(特殊普通合伙) | 代理人 | 長(zhǎng)源動(dòng)力(山東)智能科技有限公司;長(zhǎng)源動(dòng)力(北京)科技有限公司 |
地址 | 250300 山東省濟(jì)南市長(zhǎng)清區(qū)崮云湖街道辦事處丹鳳小區(qū)南區(qū)1區(qū)1號(hào)樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出了一種基于上下文的抽象樣本信息檢索系統(tǒng)。該系統(tǒng)中抽象樣本特征化表示方法利用Word2vector提取詞義特征,獲得抽象詞的詞向量;而后,對(duì)抽象詞的詞向量進(jìn)行“最優(yōu)適應(yīng)度劃分”的聚類,并根據(jù)聚類結(jié)果將抽象詞替代表示為聚類質(zhì)心;最后,根據(jù)質(zhì)心及其所代表的抽象詞的詞頻,構(gòu)成詞向量聚類質(zhì)心頻率模型(ST?IDF),用于特征化表示抽象樣本。本發(fā)明降低了聚類及適應(yīng)度計(jì)算的執(zhí)行次數(shù),提高了抽象樣本相似性分析的性能,提升了樣本分類準(zhǔn)確率。 |
