短句切分裝置、機(jī)器翻譯系統(tǒng)及對應(yīng)切分方法和翻譯方法

基本信息

申請?zhí)?/td> CN201310432908.5 申請日 -
公開(公告)號 CN103530284B 公開(公告)日 2016-07-06
申請公布號 CN103530284B 申請公布日 2016-07-06
分類號 G06F17/28(2006.01)I;G06F17/27(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 任智軍;張威;蔣宏飛;熊文;姜濤;張凱 申請(專利權(quán))人 中國專利信息中心
代理機(jī)構(gòu) 北京瑞恒信達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 中國專利信息中心
地址 100088 北京市海淀區(qū)薊門橋西土城路6號
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N短句切分的裝置和包括該裝置的機(jī)器翻譯系統(tǒng),該裝置包括順序相連的短句粗切分單元、短句句對齊單元、最小對齊塊合并單元和短句切分訓(xùn)練單元;短句粗切分單元,用于將雙語語料中的每個句子單獨(dú)以標(biāo)點(diǎn)進(jìn)行切分,形成一對一的雙語短句序列;短句句對齊單元,用于將從短句粗切分單元獲得的一對一的雙語短句序列進(jìn)行句對齊,形成具有對齊關(guān)系的短句句對齊語料;最小對齊塊合并單元,用于將短句句對齊單元處理過的短句句對齊語料進(jìn)行最小對齊塊合并,成為一對一的對齊語料;短句切分訓(xùn)練單元,用于利用一對一短句句對齊語料來訓(xùn)練短句切分模型,使用訓(xùn)練后的短句切分模型對輸入的整句進(jìn)行短句切分。