一種關(guān)鍵詞提取模型的訓(xùn)練方法及相關(guān)裝置

基本信息

申請?zhí)?/td> CN202111602825.7 申請日 -
公開(公告)號 CN114239555A 公開(公告)日 2022-03-25
申請公布號 CN114239555A 申請公布日 2022-03-25
分類號 G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李電祥;陳學(xué)珉;毛駿 申請(專利權(quán))人 上海暢圣計算機科技有限公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 王曉芬
地址 200433上海市楊浦區(qū)黃興路2005弄2號(B樓)706-9室
法律狀態(tài) -

摘要

摘要 本申請公開了一種關(guān)鍵詞提取模型的訓(xùn)練方法,包括:對原始數(shù)據(jù)進行糾錯處理,得到已糾錯數(shù)據(jù);基于同義詞詞表對所述已糾錯數(shù)據(jù)進行數(shù)據(jù)增強處理,得到第一輸入數(shù)據(jù);基于投影梯度下降方式對所述已糾錯數(shù)據(jù)進行對抗學(xué)習(xí)處理,得到第二輸入數(shù)據(jù);采用基于attention與改進型Bi?LSTM結(jié)構(gòu)的關(guān)鍵詞提取模型對所述第一輸入數(shù)據(jù)和所述第二輸入數(shù)據(jù)進行訓(xùn)練處理,得到已訓(xùn)練的所述關(guān)鍵詞模型。采用attention與改進型Bi?LSTM結(jié)構(gòu)進行特征提取,可以有效地從數(shù)據(jù)中提取關(guān)鍵信息,提高關(guān)鍵詞提取的性能和效果。本申請還公開了一種關(guān)鍵詞提取模型的訓(xùn)練裝置、服務(wù)器以及計算機可讀存儲介質(zhì),具有以上有益效果。