一種基于神經(jīng)網(wǎng)絡(luò)的文本信息提取方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202011475339.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112528643A | 公開(kāi)(公告)日 | 2021-03-19 |
申請(qǐng)公布號(hào) | CN112528643A | 申請(qǐng)公布日 | 2021-03-19 |
分類號(hào) | G06N3/08(2006.01)I;G06F40/279(2020.01)I;G06F40/126(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 姚毅;王亞雷;張亞輝;周鵬;呂德賀 | 申請(qǐng)(專利權(quán))人 | 上海棲盟科技有限公司 |
代理機(jī)構(gòu) | 上海專利商標(biāo)事務(wù)所有限公司 | 代理人 | 陶玉龍;陸嘉 |
地址 | 200082上海市楊浦區(qū)通北路729號(hào)高和云峰大廈705室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,更具體的說(shuō),涉及一種基于神經(jīng)網(wǎng)絡(luò)的文本信息提取方法及裝置。本發(fā)明提出的基于神經(jīng)網(wǎng)絡(luò)的文本信息提取方法,包括以下步驟:S1、輸入訓(xùn)練文本數(shù)據(jù);S2、快速訓(xùn)練模式下的文本預(yù)處理,提取構(gòu)造通用文本特征信息;S3、構(gòu)造快速訓(xùn)練模型并進(jìn)行訓(xùn)練;S4、深度訓(xùn)練模式下的文本預(yù)處理;S5、構(gòu)造深度訓(xùn)練模型并進(jìn)行訓(xùn)練,深度訓(xùn)練模型為編碼器解碼器結(jié)構(gòu);S6、根據(jù)快速訓(xùn)練模型和/或深度訓(xùn)練模型對(duì)文本信息進(jìn)行預(yù)測(cè)。本發(fā)明通過(guò)構(gòu)建通用的特征提取模塊和模型訓(xùn)練模塊實(shí)現(xiàn)初步的信息提取,結(jié)合進(jìn)行遠(yuǎn)程監(jiān)督對(duì)初步信息提取結(jié)果進(jìn)行修正,實(shí)現(xiàn)信息的自定義提取,通用性高、成本低、準(zhǔn)確率高。?? |
