一種面向多語言混合文本的語義審核方法與系統(tǒng)

基本信息

申請?zhí)?/td> CN202110488706.7 申請日 -
公開(公告)號 CN113158695A 公開(公告)日 2021-07-23
申請公布號 CN113158695A 申請公布日 2021-07-23
分類號 G06F40/58;G06F40/30 分類 計算;推算;計數(shù);
發(fā)明人 王曉平 申請(專利權)人 上海極鏈科技發(fā)展集團有限公司
代理機構 北京華沛德權律師事務所 代理人 房德權
地址 202150 上海市崇明區(qū)中興鎮(zhèn)汲浜公路39號21號樓1103室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及計算機的技術領域,且公開了一種面向多語言混合文本的語義審核方法與系統(tǒng),包括以下步驟:S1、鑒別主輔語言,并提取翻譯輔語言;S2、MLM模型預測;S3、翻譯候選結果優(yōu)選替換;S4、主語言語義審核;通過設計MLM模型預測模塊和翻譯候選結果優(yōu)選模塊,使用詞性標注篩選、詞向量相似度比較技術,能夠準確地從多義詞的多個翻譯結果中篩選出真正符合當前上下文語境的結果,確保了翻譯結果對原本意思的正確表達,從而為語義審核模型提供了可靠的輸入。