一種關(guān)鍵詞提取模型的訓(xùn)練方法及相關(guān)裝置
基本信息
申請?zhí)?/td> | CN202111602825.7 | 申請日 | - |
公開(公告)號 | CN114239555A | 公開(公告)日 | 2022-03-25 |
申請公布號 | CN114239555A | 申請公布日 | 2022-03-25 |
分類號 | G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李電祥;陳學(xué)珉;毛駿 | 申請(專利權(quán))人 | 上海暢圣計算機科技有限公司 |
代理機構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 王曉芬 |
地址 | 200433上海市楊浦區(qū)黃興路2005弄2號(B樓)706-9室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種關(guān)鍵詞提取模型的訓(xùn)練方法,包括:對原始數(shù)據(jù)進行糾錯處理,得到已糾錯數(shù)據(jù);基于同義詞詞表對所述已糾錯數(shù)據(jù)進行數(shù)據(jù)增強處理,得到第一輸入數(shù)據(jù);基于投影梯度下降方式對所述已糾錯數(shù)據(jù)進行對抗學(xué)習(xí)處理,得到第二輸入數(shù)據(jù);采用基于attention與改進型Bi?LSTM結(jié)構(gòu)的關(guān)鍵詞提取模型對所述第一輸入數(shù)據(jù)和所述第二輸入數(shù)據(jù)進行訓(xùn)練處理,得到已訓(xùn)練的所述關(guān)鍵詞模型。采用attention與改進型Bi?LSTM結(jié)構(gòu)進行特征提取,可以有效地從數(shù)據(jù)中提取關(guān)鍵信息,提高關(guān)鍵詞提取的性能和效果。本申請還公開了一種關(guān)鍵詞提取模型的訓(xùn)練裝置、服務(wù)器以及計算機可讀存儲介質(zhì),具有以上有益效果。 |
