短句切分裝置、機(jī)器翻譯系統(tǒng)及對應(yīng)切分方法和翻譯方法
基本信息
申請?zhí)?/td> | CN201310432908.5 | 申請日 | - |
公開(公告)號 | CN103530284B | 公開(公告)日 | 2016-07-06 |
申請公布號 | CN103530284B | 申請公布日 | 2016-07-06 |
分類號 | G06F17/28(2006.01)I;G06F17/27(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 任智軍;張威;蔣宏飛;熊文;姜濤;張凱 | 申請(專利權(quán))人 | 中國專利信息中心 |
代理機(jī)構(gòu) | 北京瑞恒信達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 中國專利信息中心 |
地址 | 100088 北京市海淀區(qū)薊門橋西土城路6號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┮环N短句切分的裝置和包括該裝置的機(jī)器翻譯系統(tǒng),該裝置包括順序相連的短句粗切分單元、短句句對齊單元、最小對齊塊合并單元和短句切分訓(xùn)練單元;短句粗切分單元,用于將雙語語料中的每個句子單獨(dú)以標(biāo)點(diǎn)進(jìn)行切分,形成一對一的雙語短句序列;短句句對齊單元,用于將從短句粗切分單元獲得的一對一的雙語短句序列進(jìn)行句對齊,形成具有對齊關(guān)系的短句句對齊語料;最小對齊塊合并單元,用于將短句句對齊單元處理過的短句句對齊語料進(jìn)行最小對齊塊合并,成為一對一的對齊語料;短句切分訓(xùn)練單元,用于利用一對一短句句對齊語料來訓(xùn)練短句切分模型,使用訓(xùn)練后的短句切分模型對輸入的整句進(jìn)行短句切分。 |
