參考多模態(tài)信息的文本摘要生成方法、電子設備及介質(zhì)

基本信息

申請?zhí)?/td> CN202210104367.2 申請日 -
公開(公告)號 CN114491006A 公開(公告)日 2022-05-13
申請公布號 CN114491006A 申請公布日 2022-05-13
分類號 G06F16/34(2019.01)I;G06F16/35(2019.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06V30/40(2022.01)I;G06V10/80(2022.01)I;G06V10/82(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張梓鍵;付衛(wèi)婷 申請(專利權)人 浙江同善人工智能技術有限公司
代理機構(gòu) 上海科盛知識產(chǎn)權代理有限公司 代理人 -
地址 314113浙江省嘉興市嘉善縣大云鎮(zhèn)創(chuàng)業(yè)路555號E1幢
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種參考多模態(tài)信息的文本摘要生成方法、電子設備及介質(zhì),包括編碼步驟和解碼步驟;編碼步驟包括:通過特征映射獲取多模態(tài)信息的序列化特征,多模態(tài)信息包括文本信息、音頻信息和圖像信息;通過注意力機制對多模態(tài)信息的序列化特征進行增強,獲得多模態(tài)信息的增強特征;對多模態(tài)信息的增強特征進行分類,獲得若干類增強特征集合;將若干類增強特征集合一一對應輸入若干個前饋神經(jīng)網(wǎng)絡中,對應獲得若干組融合特征;將若干組融合特征拼接成特征融合向量;解碼步驟包括:通過跨注意力機制,以特征融合向量作為隱狀態(tài)輸入,對文本信息的增強特征與特征融合向量進行特征融合,生成文本摘要。與現(xiàn)有技術相比,本發(fā)明具有效率高、準確性高等優(yōu)點。