一種基于神經(jīng)網(wǎng)絡的文本信息提取方法及裝置
基本信息
申請?zhí)?/td> | CN202011475339.9 | 申請日 | - |
公開(公告)號 | CN112528643A | 公開(公告)日 | 2021-03-19 |
申請公布號 | CN112528643A | 申請公布日 | 2021-03-19 |
分類號 | G06N3/08(2006.01)I;G06F40/279(2020.01)I;G06F40/126(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 姚毅;王亞雷;張亞輝;周鵬;呂德賀 | 申請(專利權)人 | 上海棲盟科技有限公司 |
代理機構 | 上海專利商標事務所有限公司 | 代理人 | 陶玉龍;陸嘉 |
地址 | 200082上海市楊浦區(qū)通北路729號高和云峰大廈705室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及自然語言處理技術領域,更具體的說,涉及一種基于神經(jīng)網(wǎng)絡的文本信息提取方法及裝置。本發(fā)明提出的基于神經(jīng)網(wǎng)絡的文本信息提取方法,包括以下步驟:S1、輸入訓練文本數(shù)據(jù);S2、快速訓練模式下的文本預處理,提取構造通用文本特征信息;S3、構造快速訓練模型并進行訓練;S4、深度訓練模式下的文本預處理;S5、構造深度訓練模型并進行訓練,深度訓練模型為編碼器解碼器結構;S6、根據(jù)快速訓練模型和/或深度訓練模型對文本信息進行預測。本發(fā)明通過構建通用的特征提取模塊和模型訓練模塊實現(xiàn)初步的信息提取,結合進行遠程監(jiān)督對初步信息提取結果進行修正,實現(xiàn)信息的自定義提取,通用性高、成本低、準確率高。?? |
