文本意圖分類的方法、裝置和可讀介質(zhì)

基本信息

申請?zhí)?/td> CN202110265003.8 申請日 -
公開(公告)號 CN112905795A 公開(公告)日 2021-06-04
申請公布號 CN112905795A 申請公布日 2021-06-04
分類號 G06F16/35;G06F40/295;G06N3/04;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 陶民澤 申請(專利權(quán))人 證通股份有限公司
代理機(jī)構(gòu) 中國專利代理(香港)有限公司 代理人 李湘;姜冰
地址 200127 上海市浦東新區(qū)錦康路308號陸家嘴世紀(jì)金融廣場6號樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及自然語言處理,特別涉及用于文本意圖的分類。按照本發(fā)明一個方面的用于生成文本意圖分類器的方法包含下列步驟:獲得訓(xùn)練數(shù)據(jù)集,訓(xùn)練數(shù)據(jù)集包含多個文本樣本,每個文本樣本包含一個或多個句子;利用訓(xùn)練數(shù)據(jù)集對第一神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)訓(xùn)練以改善第一神經(jīng)網(wǎng)絡(luò)模型與關(guān)聯(lián)于訓(xùn)練數(shù)據(jù)集的應(yīng)用領(lǐng)域之間的適配性,其中,第一神經(jīng)網(wǎng)絡(luò)模型配置為對文本樣本中的句子進(jìn)行語義分類以得到該文本樣本的特征向量;由經(jīng)過預(yù)訓(xùn)練的第一神經(jīng)網(wǎng)絡(luò)模型生成第二神經(jīng)網(wǎng)絡(luò)模型,其中,第二神經(jīng)網(wǎng)絡(luò)模型的層數(shù)少于經(jīng)過預(yù)訓(xùn)練的第一神經(jīng)網(wǎng)絡(luò)模型的層數(shù);以及將第二神經(jīng)網(wǎng)絡(luò)模型連接到輸出層以生成文本意圖分類器。