一種基于深度學(xué)習(xí)的上市公司公告分類及摘要生成方法

基本信息

申請?zhí)?/td> CN201710255476.3 申請日 -
公開(公告)號 CN107403375A 公開(公告)日 2017-11-28
申請公布號 CN107403375A 申請公布日 2017-11-28
分類號 G06Q40/04;G06F17/30 分類 計算;推算;計數(shù);
發(fā)明人 段清華;丁海星;鄭錦光;王叢;張夢迪;鮑捷;馬新磊 申請(專利權(quán))人 北京文因互聯(lián)科技有限公司
代理機構(gòu) 北京萬科園知識產(chǎn)權(quán)代理有限責(zé)任公司 代理人 杜澄心;張亞軍
地址 100094 北京市海淀區(qū)北清路68號院24號樓D座4層695
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于深度學(xué)習(xí)的上市公司公告分類及摘要生成方法,其步驟如下:步驟1、獲取公告原文數(shù)據(jù),提取文字、圖片、表格信息,建立結(jié)構(gòu)化文檔。步驟2、基于公告領(lǐng)域行業(yè)知識,根據(jù)各種公司經(jīng)營變動事件關(guān)鍵字區(qū)別,建立不同公告分類規(guī)則詞庫,統(tǒng)計判斷公告類別;步驟3、針對不同分類的公告,提取公告文檔內(nèi)容,結(jié)合相應(yīng)分類關(guān)鍵字規(guī)則詞庫,訓(xùn)練公告內(nèi)容分類模型,自動生成文檔摘要內(nèi)容,包括內(nèi)容提取、訓(xùn)練集選取、關(guān)鍵字優(yōu)化模型、模型訓(xùn)練、模型測試、結(jié)果分析、內(nèi)容生成。本發(fā)明可,解決針對每天產(chǎn)生的大量公告信息,自動對公告進行分類,并根據(jù)分類情況自動提取關(guān)鍵重要信息,生成摘要內(nèi)容等技術(shù)問題。