關(guān)鍵詞生成方法、裝置、設(shè)備及介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110365391.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112800757B | 公開(公告)日 | 2021-07-09 |
申請(qǐng)公布號(hào) | CN112800757B | 申請(qǐng)公布日 | 2021-07-09 |
分類號(hào) | G06F40/284;G06F16/36 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 嵇望;安毫億;梁青;朱鵬飛;王偉凱;錢艷 | 申請(qǐng)(專利權(quán))人 | 杭州遠(yuǎn)傳新業(yè)科技股份有限公司 |
代理機(jī)構(gòu) | 杭州創(chuàng)智卓英知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 張超 |
地址 | 310051 浙江省杭州市濱江區(qū)信誠(chéng)路857號(hào)世貿(mào)中心23樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種關(guān)鍵詞生成方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì),涉及自然語言處理技術(shù)領(lǐng)域,旨在生成高質(zhì)量的關(guān)鍵詞。該方法包含以下步驟:獲取訓(xùn)練數(shù)據(jù),該訓(xùn)練數(shù)據(jù)包括文檔、文檔中包含的主題詞和領(lǐng)域知識(shí)圖譜實(shí)體,以及文檔的標(biāo)注數(shù)據(jù);分別對(duì)文檔、主題詞和領(lǐng)域知識(shí)圖譜實(shí)體進(jìn)行特征提取,分別得到文檔特征信息、主題特征信息和領(lǐng)域特征信息;融合文檔特征信息、主題特征信息和領(lǐng)域特征信息,得到融合特征;通過文檔的標(biāo)注數(shù)據(jù)和融合特征進(jìn)行端到端模型訓(xùn)練,得到訓(xùn)練好的關(guān)鍵詞生成模型;接收待預(yù)測(cè)文檔,通過關(guān)鍵詞生成模型輸出待預(yù)測(cè)文檔的關(guān)鍵詞。 |
