文摘自動(dòng)生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202010898531.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112183083A | 公開(kāi)(公告)日 | 2021-01-05 |
申請(qǐng)公布號(hào) | CN112183083A | 申請(qǐng)公布日 | 2021-01-05 |
分類(lèi)號(hào) | G06F40/284;G06F40/295;G06F40/216;G06F40/242;G06F16/35;G06F40/126 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 嵇望;王偉凱;郭心南;董悅;李舟揚(yáng);錢(qián)艷;安毫億;朱鵬飛;梁青 | 申請(qǐng)(專(zhuān)利權(quán))人 | 杭州遠(yuǎn)傳新業(yè)科技股份有限公司 |
代理機(jī)構(gòu) | 杭州創(chuàng)智卓英知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 杭州遠(yuǎn)傳新業(yè)科技有限公司 |
地址 | 310051 浙江省杭州市濱江區(qū)信誠(chéng)路857號(hào)世貿(mào)中心23樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種文摘自動(dòng)生成方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),該方法將原始文本和原始文本中的命名實(shí)體分別基于兩個(gè)訓(xùn)練好的嵌入向量模型計(jì)算得到各單字的第一字符向量和第二字符向量并通過(guò)拼接得到各單字的詞向量;通過(guò)訓(xùn)練好的Transformer編解碼模型對(duì)各單字的詞向量編解碼處理得到多個(gè)生成詞的詞向量,可以增強(qiáng)多個(gè)生成詞的詞向量的特征表示能力,將每個(gè)生成詞分為第一類(lèi)生成詞或第二類(lèi)生成詞,對(duì)第一類(lèi)生成詞和第二類(lèi)生成詞分別采用訓(xùn)練好的指針網(wǎng)絡(luò)和記憶網(wǎng)絡(luò)計(jì)算分別得到第一類(lèi)輸出詞和第二類(lèi)輸出詞,由多個(gè)第一類(lèi)輸出詞和/或多個(gè)第二類(lèi)輸出詞組成目標(biāo)文摘,可以有效解決生僻的命名實(shí)體無(wú)法生成的問(wèn)題。 |
