一種模型訓(xùn)練方法、數(shù)據(jù)處理方法、裝置及電子設(shè)備
基本信息
申請?zhí)?/td> | CN202110227463.1 | 申請日 | - |
公開(公告)號 | CN112926737A | 公開(公告)日 | 2021-06-08 |
申請公布號 | CN112926737A | 申請公布日 | 2021-06-08 |
分類號 | G06N3/08;G06N3/04;G06F16/951;G06F40/30;G06K9/62 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張發(fā)恩;劉雨微 | 申請(專利權(quán))人 | 創(chuàng)新奇智(上海)科技有限公司 |
代理機(jī)構(gòu) | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) | 代理人 | 余菲 |
地址 | 201900 上海市寶山區(qū)上大路668號1幢569N | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請涉及一種模型訓(xùn)練方法、數(shù)據(jù)處理方法、裝置及電子設(shè)備,屬于計(jì)算機(jī)技術(shù)領(lǐng)域。該訓(xùn)練方法包括:獲取數(shù)據(jù)樣本集,并按照預(yù)設(shè)比例劃分為訓(xùn)練集和測試集,其中,所述數(shù)據(jù)樣本集包括:網(wǎng)頁中與指定目標(biāo)相關(guān)的多條正面評論文本和多條負(fù)面評論文本;利用所述訓(xùn)練集和所述測試集對BERT模型進(jìn)行迭代訓(xùn)練,得到訓(xùn)練好的情感分類模型,其中,所述BERT模型的輸入層經(jīng)過嵌入層后,沿著句子序列長度方向分別做平均池化和最大池化,并將兩者級聯(lián)。通過對BERT模型進(jìn)行改進(jìn),通過將每一句話的平均響應(yīng)和最大響應(yīng)考慮在內(nèi),使得訓(xùn)練出的詞向量不僅含有語義信息,而且還將整個(gè)句子的情感極性表達(dá)考慮在內(nèi),從而提高了情感分類預(yù)測的準(zhǔn)確性。 |
