基于transformer模型提取同義語塊對的方法

基本信息

申請?zhí)?/td> CN202210336467.8 申請日 -
公開(公告)號(hào) CN114417838A 公開(公告)日 2022-06-21
申請公布號(hào) CN114417838A 申請公布日 2022-06-21
分類號(hào) G06F40/247;G06F40/289 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 殷曉君;殷曉東;王誠文;王鴻濱 申請(專利權(quán))人 北京語言大學(xué)
代理機(jī)構(gòu) 北京市廣友專利事務(wù)所有限責(zé)任公司 代理人 張仲波
地址 100083 北京市海淀區(qū)學(xué)院路15號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及同義語塊對提取技術(shù)領(lǐng)域,特別是指一種基于transformer模型提取同義語塊對的方法,方法包括:獲取待提取語句對并輸入到transformer模型,獲取transformer模型內(nèi)部的ec_att_matrix和ecdc_att_matrix;在ec_att_matrix中,確定滿足第一條件的最小內(nèi)部矩陣,記錄對應(yīng)的語塊以及標(biāo)號(hào),將語塊確定為Query語塊;對每個(gè)Query語塊,確定滿足第二條件的最小矩陣,確定Query語塊對應(yīng)的Title語塊;根據(jù)Query語塊以及對應(yīng)的Title語塊確定同義語塊對。采用本發(fā)明,可以解決口語與書面語表達(dá)不一致的檢索問題,提高效率和準(zhǔn)確率。