一種文章關(guān)鍵句自動(dòng)標(biāo)注方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910036353.X 申請(qǐng)日 -
公開(公告)號(hào) CN111435405A 公開(公告)日 2020-07-21
申請(qǐng)公布號(hào) CN111435405A 申請(qǐng)公布日 2020-07-21
分類號(hào) G06F40/117(2020.01)I 分類 -
發(fā)明人 張靈簫;李萌;孫雪飛;王雨晗 申請(qǐng)(專利權(quán))人 北京行數(shù)通科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100081北京市海淀區(qū)丹棱街18號(hào)創(chuàng)富大廈9層902
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種文章關(guān)鍵句自動(dòng)標(biāo)注方法及裝置,主要包括:對(duì)文章進(jìn)行段落分析,拆分成多個(gè)段落;將拆分后的每一段按照標(biāo)點(diǎn)符號(hào)進(jìn)一步拆分為句子;選定最能代表文章中心的內(nèi)容,作為核心內(nèi)容;將拆分的所述多個(gè)段落按照和核心內(nèi)容內(nèi)容的語義匹配程度進(jìn)行排序;從排序靠前的段落開始,將段落中的各個(gè)句子依次按照和核心內(nèi)容的內(nèi)容語義匹配程度排序;依次在每一段中選取匹配程度達(dá)到第一閾值,且長(zhǎng)度合適的句子作為關(guān)鍵句;當(dāng)關(guān)鍵句的數(shù)量達(dá)到第二閾值時(shí),對(duì)得到的關(guān)鍵句進(jìn)行自動(dòng)標(biāo)注。本發(fā)明提出的文章關(guān)鍵句自動(dòng)標(biāo)注方法,自動(dòng)為一篇文章“劃重點(diǎn)”,也就是標(biāo)記關(guān)鍵內(nèi)容,幫助用戶閱讀文章時(shí)迅速瀏覽,快速識(shí)別、消化文章的重點(diǎn)內(nèi)容,加快信息消費(fèi)的速度,提高閱讀類軟件的用戶體驗(yàn)。??