基于transformer模型提取同義語塊對的方法
基本信息
申請?zhí)?/td> | CN202210336467.8 | 申請日 | - |
公開(公告)號(hào) | CN114417838A | 公開(公告)日 | 2022-06-21 |
申請公布號(hào) | CN114417838A | 申請公布日 | 2022-06-21 |
分類號(hào) | G06F40/247;G06F40/289 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 殷曉君;殷曉東;王誠文;王鴻濱 | 申請(專利權(quán))人 | 北京語言大學(xué) |
代理機(jī)構(gòu) | 北京市廣友專利事務(wù)所有限責(zé)任公司 | 代理人 | 張仲波 |
地址 | 100083 北京市海淀區(qū)學(xué)院路15號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及同義語塊對提取技術(shù)領(lǐng)域,特別是指一種基于transformer模型提取同義語塊對的方法,方法包括:獲取待提取語句對并輸入到transformer模型,獲取transformer模型內(nèi)部的ec_att_matrix和ecdc_att_matrix;在ec_att_matrix中,確定滿足第一條件的最小內(nèi)部矩陣,記錄對應(yīng)的語塊以及標(biāo)號(hào),將語塊確定為Query語塊;對每個(gè)Query語塊,確定滿足第二條件的最小矩陣,確定Query語塊對應(yīng)的Title語塊;根據(jù)Query語塊以及對應(yīng)的Title語塊確定同義語塊對。采用本發(fā)明,可以解決口語與書面語表達(dá)不一致的檢索問題,提高效率和準(zhǔn)確率。 |
