一種基于深度學(xué)習(xí)的上市公司公告分類及摘要生成方法
基本信息
申請?zhí)?/td> | CN201710255476.3 | 申請日 | - |
公開(公告)號 | CN107403375A | 公開(公告)日 | 2017-11-28 |
申請公布號 | CN107403375A | 申請公布日 | 2017-11-28 |
分類號 | G06Q40/04;G06F17/30 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 段清華;丁海星;鄭錦光;王叢;張夢迪;鮑捷;馬新磊 | 申請(專利權(quán))人 | 北京文因互聯(lián)科技有限公司 |
代理機構(gòu) | 北京萬科園知識產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 杜澄心;張亞軍 |
地址 | 100094 北京市海淀區(qū)北清路68號院24號樓D座4層695 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于深度學(xué)習(xí)的上市公司公告分類及摘要生成方法,其步驟如下:步驟1、獲取公告原文數(shù)據(jù),提取文字、圖片、表格信息,建立結(jié)構(gòu)化文檔。步驟2、基于公告領(lǐng)域行業(yè)知識,根據(jù)各種公司經(jīng)營變動事件關(guān)鍵字區(qū)別,建立不同公告分類規(guī)則詞庫,統(tǒng)計判斷公告類別;步驟3、針對不同分類的公告,提取公告文檔內(nèi)容,結(jié)合相應(yīng)分類關(guān)鍵字規(guī)則詞庫,訓(xùn)練公告內(nèi)容分類模型,自動生成文檔摘要內(nèi)容,包括內(nèi)容提取、訓(xùn)練集選取、關(guān)鍵字優(yōu)化模型、模型訓(xùn)練、模型測試、結(jié)果分析、內(nèi)容生成。本發(fā)明可,解決針對每天產(chǎn)生的大量公告信息,自動對公告進行分類,并根據(jù)分類情況自動提取關(guān)鍵重要信息,生成摘要內(nèi)容等技術(shù)問題。 |
