一種基于語義要素的低資源文本識別算法

基本信息

申請?zhí)?/td> CN202011001618.1 申請日 -
公開(公告)號 CN112131887A 公開(公告)日 2020-12-25
申請公布號 CN112131887A 申請公布日 2020-12-25
分類號 G06F40/30(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 付勇;井友鼎;杜創(chuàng)勝;王旭峰;甘志芳;王順智 申請(專利權(quán))人 河南合眾偉奇云智科技有限公司
代理機構(gòu) 鄭州知己知識產(chǎn)權(quán)代理有限公司 代理人 季發(fā)軍
地址 450000河南省鄭州市鄭東新區(qū)平安大道南尚德街北永和龍子湖中央廣場A座705
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于語義要素的低資源文本識別算法,屬于自然語言理解技術(shù)領(lǐng)域。所述方法包括:獲取文本句子,對文本句子進行編碼處理,得到編碼后的句子張量表示;對句子張量表示進行語義要素識別處理,得到語義要素識別結(jié)果;用語義要素識別結(jié)果對句子張量表示進行縮放處理;利用均值池化的方法對經(jīng)縮放的句子張量表示進行處理,得到語義要素向量表示;利用均值池化的方法對句子張量表示進行處理,得到句子向量表示;將句子向量表示與語義要素向量表示進行拼接處理,得到句子最終表示;對句子最終表示進行處理,得到最終的文本類型概率。本發(fā)明引入語義要素識別任務(wù)使模型具備識別不同語義要素的能力,大大降低了指令文本分類任務(wù)的學習難度。??