一種文檔標(biāo)題提取方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN201010261268.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN102375806B 公開(kāi)(公告)日 2014-05-07
申請(qǐng)公布號(hào) CN102375806B 申請(qǐng)公布日 2014-05-07
分類號(hào) G06F17/22(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李松峰;鄧姿;王長(zhǎng)橋;張軍 申請(qǐng)(專利權(quán))人 利德科技發(fā)展有限公司
代理機(jī)構(gòu) 北京天昊聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 代理人 陳源;羅建民
地址 100871 北京市海淀區(qū)成府路298號(hào)中關(guān)村方正大廈5層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種文檔標(biāo)題提取方法,包括:預(yù)置待處理文檔中的標(biāo)題的關(guān)鍵符和最大長(zhǎng)度值;根據(jù)預(yù)置的關(guān)鍵符和最大長(zhǎng)度值提取文檔文字流中的標(biāo)題文字流。相應(yīng)地,本發(fā)明提供一種文檔標(biāo)題提取裝置。本發(fā)明只需事先設(shè)置文檔標(biāo)題的關(guān)鍵符和最大長(zhǎng)度值,就可提取各種數(shù)字文檔中的標(biāo)題,尤其是對(duì)于純文本文檔的標(biāo)題提取,打破了其無(wú)屬性設(shè)置的局限性,給需要提取標(biāo)題的應(yīng)用帶來(lái)了極大的便利性。