一種基于語義的無監(jiān)督自動摘要方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202010677140.8 申請日 -
公開(公告)號 CN111813925A 公開(公告)日 2020-10-23
申請公布號 CN111813925A 申請公布日 2020-10-23
分類號 G06F16/34(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 冷若冰;蔡博克;闞野;張云;張京鵬;賁忠奇 申請(專利權)人 混沌時代(北京)教育科技有限公司
代理機構 北京魚爪知識產(chǎn)權代理有限公司 代理人 混沌時代(北京)教育科技有限公司
地址 100088北京市海淀區(qū)北三環(huán)中路44號4號樓4層406
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種基于語義的無監(jiān)督自動摘要方法及系統(tǒng),涉及深度學習領域。一種基于語義的無監(jiān)督自動摘要方法包括:獲取預設語義表達模型并存儲權重;定義正確答案的領域詞;獲取句子的語義表征向量;計算每個句子之間的語義相似度;根據(jù)PageRank對以余弦距離相似度為邊權值的無向圖進行收斂計算;選取預設數(shù)量的句子作為摘要候選集;根據(jù)句法分析與領域詞確定摘要;確定摘要候選集中得分最高的為最終摘要。其能夠確保摘取出來的句子描述內容是和領域內容強相關的。此外本發(fā)明還提出了一種基于語義的無監(jiān)督自動摘要系統(tǒng),包括:第一獲取模塊、第一定義模塊、第二獲取模塊、第一計算模塊、第二計算模塊、第一選取模塊、第一確定模塊和第二確定模塊。??