面向神經(jīng)網(wǎng)絡(luò)機器翻譯的日語動詞識別、詞性標(biāo)注方法

基本信息

申請?zhí)?/td> CN201911028262.8 申請日 -
公開(公告)號 CN110781667B 公開(公告)日 2021-10-08
申請公布號 CN110781667B 申請公布日 2021-10-08
分類號 G06F40/253;G06F40/30;G06F40/58;G06N3/04;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 張孝飛;諸敏剛;葛昱暉;陳莉莉;周聰 申請(專利權(quán))人 北京中獻(xiàn)電子技術(shù)開發(fā)有限公司
代理機構(gòu) 中科專利商標(biāo)代理有限責(zé)任公司 代理人 鄢功軍
地址 100081 北京市海淀區(qū)氣象路50號中知大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及機器翻譯技術(shù)領(lǐng)域,尤其涉及一種面向神經(jīng)網(wǎng)絡(luò)機器翻譯的日語動詞識別、詞性標(biāo)注方法及系統(tǒng)。該方法包括以下步驟:S100、刪除日語文本中的左鄰接標(biāo)志和結(jié)尾標(biāo)志的特殊詞匯;S200、查找選取得到候選動詞;S300、切分得到待還原候選動詞,對候選動詞進行還原,若驗證其正確,則該候選動詞還原成功;S400、對還原成功的動詞及其變形詞尾進行切分,標(biāo)注詞性及其語法意義。本發(fā)明通過加入二次判斷機制及完善復(fù)合動詞的識別處理規(guī)則,提高了動詞識別的準(zhǔn)確度;同時對動詞及其變形詞尾進行詞干、詞尾、可能表現(xiàn)、時、態(tài)、情態(tài)的切分,有效提高了詞法分析的準(zhǔn)確性,從而有效提升了譯文質(zhì)量。