XML文本數(shù)據(jù)翻譯方法和裝置、電子設(shè)備、存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110609589.5 申請(qǐng)日 -
公開(公告)號(hào) CN113378585A 公開(公告)日 2021-09-10
申請(qǐng)公布號(hào) CN113378585A 申請(qǐng)公布日 2021-09-10
分類號(hào) G06F40/58(2020.01)I;G06F40/42(2020.01)I;G06F40/166(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 宋超;賀彬彬 申請(qǐng)(專利權(quán))人 武漢金山辦公軟件有限公司
代理機(jī)構(gòu) 北京博思佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 林祥
地址 519015廣東省珠海市高新區(qū)唐家灣鎮(zhèn)前島環(huán)路321號(hào)金山軟件園5號(hào)樓
法律狀態(tài) -

摘要

摘要 本公開是關(guān)于一種XML文本數(shù)據(jù)翻譯方法和裝置、電子設(shè)備、存儲(chǔ)介質(zhì)。該方法包括:獲取XML文本數(shù)據(jù);XML文本數(shù)據(jù)采用預(yù)設(shè)的數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn),預(yù)設(shè)結(jié)構(gòu)包括至少一個(gè)段落節(jié)點(diǎn);遍歷各段落節(jié)點(diǎn)的文本內(nèi)容,獲得各段落節(jié)點(diǎn)的文本內(nèi)容中所包含的至少一條語句;將各條語句輸入到預(yù)設(shè)的翻譯模型,由翻譯模型對(duì)各條語句進(jìn)行翻譯,獲得各條語句對(duì)應(yīng)的第一目標(biāo)譯句;將第一目標(biāo)譯句的文本屬性調(diào)整為對(duì)應(yīng)語句的目標(biāo)文本屬性,獲得第二目標(biāo)譯句;將第二目標(biāo)譯句回填到對(duì)應(yīng)語句在預(yù)設(shè)結(jié)構(gòu)的節(jié)點(diǎn)中,獲得XML文本數(shù)據(jù)對(duì)應(yīng)的目標(biāo)譯文。本實(shí)施例可以對(duì)文本數(shù)據(jù)中不同段落實(shí)現(xiàn)強(qiáng)制分割,可以避免相鄰兩個(gè)段落中語句因沒有標(biāo)識(shí)符號(hào)而被合并一起所帶來的噪聲。