XML文本數(shù)據翻譯方法和裝置、電子設備、存儲介質

基本信息

申請?zhí)?/td> CN202110609589.5 申請日 -
公開(公告)號 CN113378585A 公開(公告)日 2021-09-10
申請公布號 CN113378585A 申請公布日 2021-09-10
分類號 G06F40/58(2020.01)I;G06F40/42(2020.01)I;G06F40/166(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 宋超;賀彬彬 申請(專利權)人 武漢金山辦公軟件有限公司
代理機構 北京博思佳知識產權代理有限公司 代理人 林祥
地址 519015廣東省珠海市高新區(qū)唐家灣鎮(zhèn)前島環(huán)路321號金山軟件園5號樓
法律狀態(tài) -

摘要

摘要 本公開是關于一種XML文本數(shù)據翻譯方法和裝置、電子設備、存儲介質。該方法包括:獲取XML文本數(shù)據;XML文本數(shù)據采用預設的數(shù)據結構實現(xiàn),預設結構包括至少一個段落節(jié)點;遍歷各段落節(jié)點的文本內容,獲得各段落節(jié)點的文本內容中所包含的至少一條語句;將各條語句輸入到預設的翻譯模型,由翻譯模型對各條語句進行翻譯,獲得各條語句對應的第一目標譯句;將第一目標譯句的文本屬性調整為對應語句的目標文本屬性,獲得第二目標譯句;將第二目標譯句回填到對應語句在預設結構的節(jié)點中,獲得XML文本數(shù)據對應的目標譯文。本實施例可以對文本數(shù)據中不同段落實現(xiàn)強制分割,可以避免相鄰兩個段落中語句因沒有標識符號而被合并一起所帶來的噪聲。