一種面向新聞優(yōu)化閱讀類移動應(yīng)用的自動摘要方法

基本信息

申請?zhí)?/td> CN201510063837.5 申請日 -
公開(公告)號 CN104657347A 公開(公告)日 2015-05-27
申請公布號 CN104657347A 申請公布日 2015-05-27
分類號 G06F17/27(2006.01)I;G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 尹柳;許歡慶;郭永福;陳沛 申請(專利權(quán))人 北京中搜搜悅網(wǎng)絡(luò)技術(shù)有限公司
代理機構(gòu) 北京安博達知識產(chǎn)權(quán)代理有限公司 代理人 北京中搜網(wǎng)絡(luò)技術(shù)股份有限公司;北京中搜搜悅網(wǎng)絡(luò)技術(shù)有限公司
地址 100191 北京市海淀區(qū)學(xué)院路51號首亨科技大廈0902室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種面向新聞優(yōu)化閱讀類移動應(yīng)用的自動摘要方法,其特征在于,所述方法包括(1)預(yù)處理新聞網(wǎng)頁內(nèi)容;(2)提取文本摘要;(3)生成結(jié)果。本發(fā)明增加html格式,保留圖片和表格,優(yōu)化了文摘的展現(xiàn)形式,增強了用戶視覺體驗。傳統(tǒng)自動摘要有語義缺失,本發(fā)明對句子進行上下文擴展,并合并空句以省略號連接,彌補了傳統(tǒng)摘要語義缺失,提高了語義的完整性和連貫性。本發(fā)明設(shè)置了摘要占原文的百分比和摘要長度兩個可選項,供用戶選擇設(shè)置,提高了靈活性。隨機抽取100篇文章,經(jīng)過人工校驗,通過率達99.8%。