一種基于序列到序列的文本量化分析與生成方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202011284523.5 申請日 -
公開(公告)號 CN112395832A 公開(公告)日 2021-02-23
申請公布號 CN112395832A 申請公布日 2021-02-23
分類號 G06F40/126(2020.01)I; 分類 計算;推算;計數(shù);
發(fā)明人 汪昕;周興暉;呂建文;金鑫;陳力;薛柔月;蔣尚秀 申請(專利權(quán))人 上海金橋信息股份有限公司
代理機(jī)構(gòu) 北京科迪生專利代理有限責(zé)任公司 代理人 鄧治平
地址 200234上海市徐匯區(qū)田林路487號25號樓
法律狀態(tài) -

摘要

摘要 一種基于序列到序列的文本量化分析與生成方法及系統(tǒng),可根據(jù)已知的文本自動生成與所需要進(jìn)行量化分析的文本所對應(yīng)的文本。該系統(tǒng)包括:預(yù)處理模塊、文本內(nèi)容編碼器模塊、量化分析編碼器模塊,解碼器模塊。本發(fā)明使得用戶不需要手動將文本信息轉(zhuǎn)化為特征向量,提高了轉(zhuǎn)換的效率;同時,采用基于序列到序列的神經(jīng)網(wǎng)絡(luò)算法作為生成文本和對文本進(jìn)行量化分析的主要方法,在生成文本的過程中可使用GPU進(jìn)行加速,進(jìn)一步提高了轉(zhuǎn)換速率;基于序列到序列的神經(jīng)網(wǎng)絡(luò)算法也通過多次迭代提高了生成文本和所進(jìn)行量化分析的文本的質(zhì)量,避免了單一的模板化的文本生成。??