文摘自動(dòng)生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202010898531.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112183083A 公開(kāi)(公告)日 2021-01-05
申請(qǐng)公布號(hào) CN112183083A 申請(qǐng)公布日 2021-01-05
分類(lèi)號(hào) G06F40/284;G06F40/295;G06F40/216;G06F40/242;G06F16/35;G06F40/126 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 嵇望;王偉凱;郭心南;董悅;李舟揚(yáng);錢(qián)艷;安毫億;朱鵬飛;梁青 申請(qǐng)(專(zhuān)利權(quán))人 杭州遠(yuǎn)傳新業(yè)科技股份有限公司
代理機(jī)構(gòu) 杭州創(chuàng)智卓英知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 杭州遠(yuǎn)傳新業(yè)科技有限公司
地址 310051 浙江省杭州市濱江區(qū)信誠(chéng)路857號(hào)世貿(mào)中心23樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種文摘自動(dòng)生成方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),該方法將原始文本和原始文本中的命名實(shí)體分別基于兩個(gè)訓(xùn)練好的嵌入向量模型計(jì)算得到各單字的第一字符向量和第二字符向量并通過(guò)拼接得到各單字的詞向量;通過(guò)訓(xùn)練好的Transformer編解碼模型對(duì)各單字的詞向量編解碼處理得到多個(gè)生成詞的詞向量,可以增強(qiáng)多個(gè)生成詞的詞向量的特征表示能力,將每個(gè)生成詞分為第一類(lèi)生成詞或第二類(lèi)生成詞,對(duì)第一類(lèi)生成詞和第二類(lèi)生成詞分別采用訓(xùn)練好的指針網(wǎng)絡(luò)和記憶網(wǎng)絡(luò)計(jì)算分別得到第一類(lèi)輸出詞和第二類(lèi)輸出詞,由多個(gè)第一類(lèi)輸出詞和/或多個(gè)第二類(lèi)輸出詞組成目標(biāo)文摘,可以有效解決生僻的命名實(shí)體無(wú)法生成的問(wèn)題。