一種在線語料對齊方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201610456896.3 申請日 -
公開(公告)號 CN106126506B 公開(公告)日 2019-10-22
申請公布號 CN106126506B 申請公布日 2019-10-22
分類號 G06F17/28 分類 計算;推算;計數(shù);
發(fā)明人 張井;陳件 申請(專利權(quán))人 上海一者信息科技有限公司
代理機構(gòu) 上海驍象知識產(chǎn)權(quán)代理有限公司 代理人 上海一者信息科技有限公司
地址 201306 上海市浦東新區(qū)泥城鎮(zhèn)新城路2號5幢1831室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種在線語料對齊方法及系統(tǒng),該方法包括步驟:解析雙語互譯文件得到結(jié)果文件;對結(jié)果文件進行段落調(diào)整,使得原文和譯文之間段落對照;對原文和譯文通過預(yù)設(shè)斷句規(guī)則自動進行斷句得到原文句子和譯文句子,按照預(yù)設(shè)排列規(guī)則,計算得到原文句子和譯文句子的排列組合;計算每種原文句子和譯文句子排列組合對應(yīng)的句子相似度,選取相似度最大的排列組合作為最終的句句對齊結(jié)果。本發(fā)明有助于提高對齊準確率。