一種關(guān)鍵詞提取模型的訓(xùn)練方法及相關(guān)裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202111602825.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114239555A | 公開(公告)日 | 2022-03-25 |
申請(qǐng)公布號(hào) | CN114239555A | 申請(qǐng)公布日 | 2022-03-25 |
分類號(hào) | G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李電祥;陳學(xué)珉;毛駿 | 申請(qǐng)(專利權(quán))人 | 上海暢圣計(jì)算機(jī)科技有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 王曉芬 |
地址 | 200433上海市楊浦區(qū)黃興路2005弄2號(hào)(B樓)706-9室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種關(guān)鍵詞提取模型的訓(xùn)練方法,包括:對(duì)原始數(shù)據(jù)進(jìn)行糾錯(cuò)處理,得到已糾錯(cuò)數(shù)據(jù);基于同義詞詞表對(duì)所述已糾錯(cuò)數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)處理,得到第一輸入數(shù)據(jù);基于投影梯度下降方式對(duì)所述已糾錯(cuò)數(shù)據(jù)進(jìn)行對(duì)抗學(xué)習(xí)處理,得到第二輸入數(shù)據(jù);采用基于attention與改進(jìn)型Bi?LSTM結(jié)構(gòu)的關(guān)鍵詞提取模型對(duì)所述第一輸入數(shù)據(jù)和所述第二輸入數(shù)據(jù)進(jìn)行訓(xùn)練處理,得到已訓(xùn)練的所述關(guān)鍵詞模型。采用attention與改進(jìn)型Bi?LSTM結(jié)構(gòu)進(jìn)行特征提取,可以有效地從數(shù)據(jù)中提取關(guān)鍵信息,提高關(guān)鍵詞提取的性能和效果。本申請(qǐng)還公開了一種關(guān)鍵詞提取模型的訓(xùn)練裝置、服務(wù)器以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),具有以上有益效果。 |
