一種基于神經(jīng)網(wǎng)絡的文本信息提取方法及裝置

基本信息

申請?zhí)?/td> CN202011475339.9 申請日 -
公開(公告)號 CN112528643A 公開(公告)日 2021-03-19
申請公布號 CN112528643A 申請公布日 2021-03-19
分類號 G06N3/08(2006.01)I;G06F40/279(2020.01)I;G06F40/126(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 姚毅;王亞雷;張亞輝;周鵬;呂德賀 申請(專利權)人 上海棲盟科技有限公司
代理機構 上海專利商標事務所有限公司 代理人 陶玉龍;陸嘉
地址 200082上海市楊浦區(qū)通北路729號高和云峰大廈705室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及自然語言處理技術領域,更具體的說,涉及一種基于神經(jīng)網(wǎng)絡的文本信息提取方法及裝置。本發(fā)明提出的基于神經(jīng)網(wǎng)絡的文本信息提取方法,包括以下步驟:S1、輸入訓練文本數(shù)據(jù);S2、快速訓練模式下的文本預處理,提取構造通用文本特征信息;S3、構造快速訓練模型并進行訓練;S4、深度訓練模式下的文本預處理;S5、構造深度訓練模型并進行訓練,深度訓練模型為編碼器解碼器結構;S6、根據(jù)快速訓練模型和/或深度訓練模型對文本信息進行預測。本發(fā)明通過構建通用的特征提取模塊和模型訓練模塊實現(xiàn)初步的信息提取,結合進行遠程監(jiān)督對初步信息提取結果進行修正,實現(xiàn)信息的自定義提取,通用性高、成本低、準確率高。??