文本摘要的抽取方法、裝置、可讀存儲(chǔ)介質(zhì)及電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202011112242.1 申請(qǐng)日 -
公開(公告)號(hào) CN112347240A 公開(公告)日 2021-02-09
申請(qǐng)公布號(hào) CN112347240A 申請(qǐng)公布日 2021-02-09
分類號(hào) G06F16/34(2019.01)I; 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 姜濤;王會(huì)珍;張新新 申請(qǐng)(專利權(quán))人 小牛思拓(北京)科技有限公司
代理機(jī)構(gòu) 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 代理人 畢翔宇
地址 100000北京市北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)科創(chuàng)十三街18號(hào)院6號(hào)樓1層104
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝宋谋菊某槿》椒ā⒀b置、可讀存儲(chǔ)介質(zhì)及電子設(shè)備,將待抽取文本分割成多個(gè)語句;針對(duì)于每一個(gè)語句,比較該語句與其他語句之間的多個(gè)相似度,確定該語句的第一系數(shù);將該語句輸入至實(shí)體識(shí)別模型中,確定該語句的第二系數(shù);基于第一系數(shù)、第二系數(shù)以及該語句的位置,確定該語句的綜合系數(shù);將綜合系數(shù)排序位于預(yù)設(shè)位置之前的至少一個(gè)目標(biāo)語句,組合成待抽取文本的摘要。這樣,通過計(jì)算語句相似度、語句中實(shí)體數(shù)量以及語句在文本中的位置,確定出每個(gè)語句的綜合系數(shù),進(jìn)而依據(jù)每個(gè)語句的綜合系數(shù)的排序,確定出文本的摘要,可以提高語句抽取的全面性以及準(zhǔn)確率,有助于提高摘要的抽取質(zhì)量以及可讀性。??