一種用于生成關(guān)鍵詞的方法與設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202010006961.9 申請(qǐng)日 -
公開(公告)號(hào) CN111209468A 公開(公告)日 2020-05-29
申請(qǐng)公布號(hào) CN111209468A 申請(qǐng)公布日 2020-05-29
分類號(hào) G06F16/9532;G06F16/33;G06F16/35;G06F40/289;G06F40/30;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 刁詩哲;宋彥;王詠剛 申請(qǐng)(專利權(quán))人 創(chuàng)新工場(chǎng)(廣州)人工智能研究有限公司
代理機(jī)構(gòu) 北京啟坤知識(shí)產(chǎn)權(quán)代理有限公司 代理人 高雅
地址 510700 廣東省廣州市黃埔區(qū)光譜中路23號(hào)A2棟1001房
法律狀態(tài) -

摘要

摘要 本申請(qǐng)的目的是提供一種用于生成關(guān)鍵詞的方法與設(shè)備。生成設(shè)備獲取輸入文本的單詞嵌入向量以及整體文本向量;將所述單詞嵌入向量輸入編碼器,并經(jīng)由所述編碼器編碼,以獲得與所述單詞嵌入向量相對(duì)應(yīng)的編碼隱向量;將所述整體文本向量輸入記憶力網(wǎng)絡(luò)中,以獲取與所述整體文本向量以及所述記憶力網(wǎng)絡(luò)中所包含的相關(guān)文檔相對(duì)應(yīng)的輸出隱向量;將所述編碼隱向量以及所述輸出隱向量輸入到解碼器中,并經(jīng)由所述解碼器解碼,以獲取與所述輸入文本相對(duì)應(yīng)的詞表概率分布。本申請(qǐng)同時(shí)解決了OOV的問題和生成未出現(xiàn)詞的問題,也解決了傳統(tǒng)的RNN的模型梯度消失和梯度爆炸等問題,可以準(zhǔn)確地為任何輸入文檔生成高度相關(guān)并且全面的關(guān)鍵詞。