一種基于突發(fā)事件的詞向量語言模型

基本信息

申請?zhí)?/td> CN201910915299.6 申請日 -
公開(公告)號 CN110688485A 公開(公告)日 2020-01-14
申請公布號 CN110688485A 申請公布日 2020-01-14
分類號 G06F16/35(2019.01); G06F40/30(2020.01); G06F40/289(2020.01); G06K9/62(2006.01); G06N3/04(2006.01) 分類 計算;推算;計數(shù);
發(fā)明人 趙鑫; 朱秋昱; 張明 申請(專利權(quán))人 杭州筆聲智能科技有限公司
代理機構(gòu) 北京邦創(chuàng)至誠知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 中國人民大學(xué); 杭州筆聲智能科技有限公司
地址 100872 北京市海淀區(qū)中關(guān)村大街59號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于突發(fā)事件的詞向量語言模型,所述語言模型使用傳統(tǒng)的Word2Vec模型對上下文進行訓(xùn)練,所述訓(xùn)練包括在模型的輸入層計算出輸入的隱藏層信息同時在輸入層加入突發(fā)事件的向量表示將和通過加權(quán)求和得到最終的隱藏層表示使二者共同影響最終隱藏層表示,生成的隱藏層表示不僅與所述上下文相關(guān),而且和所述突發(fā)事件相關(guān)。本發(fā)明提出了一種新的與突發(fā)事件相關(guān)的詞向量模型,用于包含突發(fā)事件的文本流數(shù)據(jù)建模。本發(fā)明能夠?qū)W習(xí)帶有突發(fā)事件特點的詞向量模型來識別語義變化,并且加入了突發(fā)事件向量表示來提高語義相關(guān)性。