基于翻譯的專業(yè)垂直領(lǐng)域文本同義改寫方法

基本信息

申請?zhí)?/td> CN202011449188.X 申請日 -
公開(公告)號 CN112560509A 公開(公告)日 2021-03-26
申請公布號 CN112560509A 申請公布日 2021-03-26
分類號 G06N3/08(2006.01)I;G06F40/58(2020.01)I;G06N3/04(2006.01)I;G06F40/45(2020.01)I;G06F40/242(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王征;羅學優(yōu) 申請(專利權(quán))人 杭州艾耕科技有限公司
代理機構(gòu) 杭州天昊專利代理事務(wù)所(特殊普通合伙) 代理人 何碧珩;卓彩霞
地址 310052浙江省杭州市濱江區(qū)六和路368號一幢(北)三樓D3052室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于翻譯的專業(yè)垂直領(lǐng)域文本同義改寫方法,包括以下步驟:輸入待改寫文本;確定垂直領(lǐng)域?qū)S忻~,并選擇規(guī)避詞匯;將待改寫文本的中文翻譯成英文,并加入專有名詞;將英文翻譯成中文,使翻譯結(jié)果中不出現(xiàn)規(guī)避詞匯;輸出改寫結(jié)果。本發(fā)明在輸入端提供垂直領(lǐng)域的專有名詞信息,優(yōu)化了文本改寫過程中專有名詞的保持能力,使得垂直領(lǐng)域的相關(guān)文本改寫結(jié)果質(zhì)量更佳。在生成文本時,采取特定的解碼策略,使得本發(fā)明能提供不同改寫幅度的結(jié)果,滿足了不同的場景下的改寫幅度需求,提高了靈活性。同時,本發(fā)明所采用的解碼策略也能夠提供具有隨機性的多種改寫結(jié)果,具備更強的多樣性。??