一種文檔標(biāo)題提取方法和裝置
基本信息
申請?zhí)?/td> | CN201010261268.2 | 申請日 | - |
公開(公告)號 | CN102375806A | 公開(公告)日 | 2012-03-14 |
申請公布號 | CN102375806A | 申請公布日 | 2012-03-14 |
分類號 | G06F17/22(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李松峰;鄧姿;王長橋;張軍 | 申請(專利權(quán))人 | 北京文房飛閱傳媒技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京天昊聯(lián)合知識產(chǎn)權(quán)代理有限公司 | 代理人 | 北大方正集團(tuán)有限公司;北京方正飛閱傳媒技術(shù)有限公司;利德科技發(fā)展有限公司 |
地址 | 100871 北京市海淀區(qū)成府路298號中關(guān)村方正大廈5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種文檔標(biāo)題提取方法,包括:預(yù)置待處理文檔中的標(biāo)題的關(guān)鍵符和最大長度值;根據(jù)預(yù)置的關(guān)鍵符和最大長度值提取文檔文字流中的標(biāo)題文字流。相應(yīng)地,本發(fā)明提供一種文檔標(biāo)題提取裝置。本發(fā)明只需事先設(shè)置文檔標(biāo)題的關(guān)鍵符和最大長度值,就可提取各種數(shù)字文檔中的標(biāo)題,尤其是對于純文本文檔的標(biāo)題提取,打破了其無屬性設(shè)置的局限性,給需要提取標(biāo)題的應(yīng)用帶來了極大的便利性。 |
