基于文本語義的篇章結構分析方法

基本信息

申請?zhí)?/td> CN201710307876.4 申請日 -
公開(公告)號 CN107145479A 公開(公告)日 2017-09-08
申請公布號 CN107145479A 申請公布日 2017-09-08
分類號 G06F17/22(2006.01)I;G06F17/27(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張夢迪;鄭錦光;段清華;吳珂皓;鮑捷;馬新磊 申請(專利權)人 合肥圖譜智能科技有限公司
代理機構 北京萬科園知識產(chǎn)權代理有限責任公司 代理人 北京文因互聯(lián)科技有限公司;合肥文因互聯(lián)科技有限公司
地址 100094 北京市海淀區(qū)北清路68號院24號樓D座4層695
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于文本語義的篇章結構分析方法,其步驟如下:步驟1,數(shù)據(jù)獲??;步驟2,正文抽??;步驟3,標題識別和抽??;步驟4,層級結構構建。本發(fā)明可以解決純文本的文檔結構信息還原,為文本挖掘任務鋪墊基礎等技術問題。