一種基于文本結(jié)構(gòu)的文本分析方法、系統(tǒng)、設(shè)備和介質(zhì)

基本信息

申請?zhí)?/td> CN202210145827.6 申請日 -
公開(公告)號 CN114611484A 公開(公告)日 2022-06-10
申請公布號 CN114611484A 申請公布日 2022-06-10
分類號 G06F40/205(2020.01)I;G06F40/258(2020.01)I;G06F40/284(2020.01)I;G06K9/62(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 許偉;杜瑋;王明明;徐頓 申請(專利權(quán))人 中國人民大學
代理機構(gòu) 北京紀凱知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 100872北京市海淀區(qū)中關(guān)村大街59號中國人民大學
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于文本結(jié)構(gòu)的文本分析方法、系統(tǒng)、設(shè)備和介質(zhì),其包括以下步驟:對獲取的待分析文本進行解析,得到其文本結(jié)構(gòu);分別對待分析文本的各文本結(jié)構(gòu)進行機器閱讀,得到各文本結(jié)構(gòu)所對應(yīng)的嵌入向量;將得到的各嵌入向量進行融合,得到融合的文章嵌入向量;基于融合得到的文章嵌入向量得到文本分析結(jié)果。本發(fā)明考慮了文章結(jié)構(gòu)對于機器理解的重要意義,依照摘要?段落{段落標題?段落內(nèi)容}的結(jié)構(gòu)進行解析,使模型具有了分結(jié)構(gòu)閱讀的能力。因此,本發(fā)明可以廣泛應(yīng)用于文本分析領(lǐng)域。