一種在線語料對齊方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201610456896.3 | 申請日 | - |
公開(公告)號 | CN106126506B | 公開(公告)日 | 2019-10-22 |
申請公布號 | CN106126506B | 申請公布日 | 2019-10-22 |
分類號 | G06F17/28 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張井;陳件 | 申請(專利權(quán))人 | 上海一者信息科技有限公司 |
代理機構(gòu) | 上海驍象知識產(chǎn)權(quán)代理有限公司 | 代理人 | 上海一者信息科技有限公司 |
地址 | 201306 上海市浦東新區(qū)泥城鎮(zhèn)新城路2號5幢1831室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種在線語料對齊方法及系統(tǒng),該方法包括步驟:解析雙語互譯文件得到結(jié)果文件;對結(jié)果文件進行段落調(diào)整,使得原文和譯文之間段落對照;對原文和譯文通過預(yù)設(shè)斷句規(guī)則自動進行斷句得到原文句子和譯文句子,按照預(yù)設(shè)排列規(guī)則,計算得到原文句子和譯文句子的排列組合;計算每種原文句子和譯文句子排列組合對應(yīng)的句子相似度,選取相似度最大的排列組合作為最終的句句對齊結(jié)果。本發(fā)明有助于提高對齊準確率。 |
