一種文本摘要自動(dòng)生成方法

基本信息

申請(qǐng)?zhí)?/td> CN202010070964.9 申請(qǐng)日 -
公開(公告)號(hào) CN111241268A 公開(公告)日 2020-06-05
申請(qǐng)公布號(hào) CN111241268A 申請(qǐng)公布日 2020-06-05
分類號(hào) G06F16/34(2019.01)I;G06F40/211(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 繆弘;甘露 申請(qǐng)(專利權(quán))人 上海七印信息科技有限公司
代理機(jī)構(gòu) 上海天翔知識(shí)產(chǎn)權(quán)代理有限公司 代理人 上海七印信息科技有限公司
地址 201306上海市浦東新區(qū)泥城鎮(zhèn)云漢路979號(hào)2樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開的一種文本摘要自動(dòng)生成方法,包括以下步驟:接收需要生成摘要的文章;對(duì)接收到的文章進(jìn)行分句處理,以將該文章分成若干句子;使用TextRank算法計(jì)算每一句子的內(nèi)容相關(guān)度權(quán)重;根據(jù)預(yù)設(shè)的規(guī)則,計(jì)算每一句子的規(guī)則權(quán)重;使用滑動(dòng)窗口的方法對(duì)計(jì)算得到的每一句子的內(nèi)容相關(guān)度權(quán)重和規(guī)則權(quán)重進(jìn)行處理,以計(jì)算在滑動(dòng)窗口內(nèi)每一句子的權(quán)重和;選取權(quán)重和最大的滑動(dòng)窗口內(nèi)的句子,并將選取的句子拼湊按照一定順序拼湊形成該文章的摘要。本發(fā)明能夠防止摘要中出現(xiàn)斷句的情況,提升摘要的質(zhì)量和通順程度。??