一種基于神經(jīng)網(wǎng)絡(luò)的文本信息提取方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202011475339.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112528643A 公開(kāi)(公告)日 2021-03-19
申請(qǐng)公布號(hào) CN112528643A 申請(qǐng)公布日 2021-03-19
分類號(hào) G06N3/08(2006.01)I;G06F40/279(2020.01)I;G06F40/126(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 姚毅;王亞雷;張亞輝;周鵬;呂德賀 申請(qǐng)(專利權(quán))人 上海棲盟科技有限公司
代理機(jī)構(gòu) 上海專利商標(biāo)事務(wù)所有限公司 代理人 陶玉龍;陸嘉
地址 200082上海市楊浦區(qū)通北路729號(hào)高和云峰大廈705室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,更具體的說(shuō),涉及一種基于神經(jīng)網(wǎng)絡(luò)的文本信息提取方法及裝置。本發(fā)明提出的基于神經(jīng)網(wǎng)絡(luò)的文本信息提取方法,包括以下步驟:S1、輸入訓(xùn)練文本數(shù)據(jù);S2、快速訓(xùn)練模式下的文本預(yù)處理,提取構(gòu)造通用文本特征信息;S3、構(gòu)造快速訓(xùn)練模型并進(jìn)行訓(xùn)練;S4、深度訓(xùn)練模式下的文本預(yù)處理;S5、構(gòu)造深度訓(xùn)練模型并進(jìn)行訓(xùn)練,深度訓(xùn)練模型為編碼器解碼器結(jié)構(gòu);S6、根據(jù)快速訓(xùn)練模型和/或深度訓(xùn)練模型對(duì)文本信息進(jìn)行預(yù)測(cè)。本發(fā)明通過(guò)構(gòu)建通用的特征提取模塊和模型訓(xùn)練模塊實(shí)現(xiàn)初步的信息提取,結(jié)合進(jìn)行遠(yuǎn)程監(jiān)督對(duì)初步信息提取結(jié)果進(jìn)行修正,實(shí)現(xiàn)信息的自定義提取,通用性高、成本低、準(zhǔn)確率高。??