一種面向新聞優(yōu)化閱讀類移動應(yīng)用的自動摘要方法
基本信息
申請?zhí)?/td> | CN201510063837.5 | 申請日 | - |
公開(公告)號 | CN104657347A | 公開(公告)日 | 2015-05-27 |
申請公布號 | CN104657347A | 申請公布日 | 2015-05-27 |
分類號 | G06F17/27(2006.01)I;G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 尹柳;許歡慶;郭永福;陳沛 | 申請(專利權(quán))人 | 北京中搜搜悅網(wǎng)絡(luò)技術(shù)有限公司 |
代理機構(gòu) | 北京安博達知識產(chǎn)權(quán)代理有限公司 | 代理人 | 北京中搜網(wǎng)絡(luò)技術(shù)股份有限公司;北京中搜搜悅網(wǎng)絡(luò)技術(shù)有限公司 |
地址 | 100191 北京市海淀區(qū)學(xué)院路51號首亨科技大廈0902室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種面向新聞優(yōu)化閱讀類移動應(yīng)用的自動摘要方法,其特征在于,所述方法包括(1)預(yù)處理新聞網(wǎng)頁內(nèi)容;(2)提取文本摘要;(3)生成結(jié)果。本發(fā)明增加html格式,保留圖片和表格,優(yōu)化了文摘的展現(xiàn)形式,增強了用戶視覺體驗。傳統(tǒng)自動摘要有語義缺失,本發(fā)明對句子進行上下文擴展,并合并空句以省略號連接,彌補了傳統(tǒng)摘要語義缺失,提高了語義的完整性和連貫性。本發(fā)明設(shè)置了摘要占原文的百分比和摘要長度兩個可選項,供用戶選擇設(shè)置,提高了靈活性。隨機抽取100篇文章,經(jīng)過人工校驗,通過率達99.8%。 |
