一種文本摘要自動(dòng)生成方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010070964.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111241268A | 公開(公告)日 | 2020-06-05 |
申請(qǐng)公布號(hào) | CN111241268A | 申請(qǐng)公布日 | 2020-06-05 |
分類號(hào) | G06F16/34(2019.01)I;G06F40/211(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 繆弘;甘露 | 申請(qǐng)(專利權(quán))人 | 上海七印信息科技有限公司 |
代理機(jī)構(gòu) | 上海天翔知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 上海七印信息科技有限公司 |
地址 | 201306上海市浦東新區(qū)泥城鎮(zhèn)云漢路979號(hào)2樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開的一種文本摘要自動(dòng)生成方法,包括以下步驟:接收需要生成摘要的文章;對(duì)接收到的文章進(jìn)行分句處理,以將該文章分成若干句子;使用TextRank算法計(jì)算每一句子的內(nèi)容相關(guān)度權(quán)重;根據(jù)預(yù)設(shè)的規(guī)則,計(jì)算每一句子的規(guī)則權(quán)重;使用滑動(dòng)窗口的方法對(duì)計(jì)算得到的每一句子的內(nèi)容相關(guān)度權(quán)重和規(guī)則權(quán)重進(jìn)行處理,以計(jì)算在滑動(dòng)窗口內(nèi)每一句子的權(quán)重和;選取權(quán)重和最大的滑動(dòng)窗口內(nèi)的句子,并將選取的句子拼湊按照一定順序拼湊形成該文章的摘要。本發(fā)明能夠防止摘要中出現(xiàn)斷句的情況,提升摘要的質(zhì)量和通順程度。?? |
