一種閱讀理解模型訓(xùn)練數(shù)據(jù)的過(guò)濾方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201811644614.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109766424B 公開(kāi)(公告)日 2021-11-19
申請(qǐng)公布號(hào) CN109766424B 申請(qǐng)公布日 2021-11-19
分類(lèi)號(hào) G06F16/332(2019.01)I;G06F16/33(2019.01)I;G06F16/35(2019.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李健銓;劉小康;晉耀紅 申請(qǐng)(專(zhuān)利權(quán))人 安徽省泰岳祥升軟件有限公司
代理機(jī)構(gòu) 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 逯長(zhǎng)明;許偉群
地址 230088安徽省合肥市高新區(qū)習(xí)友路3333號(hào)中國(guó)(合肥)國(guó)際智能語(yǔ)音產(chǎn)業(yè)園研發(fā)中心樓405-5室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開(kāi)一種閱讀理解模型訓(xùn)練數(shù)據(jù)的過(guò)濾方法及裝置,首先獲取輸入文本,將輸入文本表示為包含詞匯共現(xiàn)信息和位置編碼信息的第二詞向量;其次根據(jù)輸入文本的注意力對(duì)第二詞向量進(jìn)行加權(quán);對(duì)第二詞向量的加權(quán)結(jié)果進(jìn)行歸一化處理生成第一輸出矩陣;再對(duì)第一輸出矩陣進(jìn)行全連接的線性變換處理并進(jìn)行歸一化處理,生成第二輸出矩陣;然后根據(jù)第二輸出矩陣生成低維特征向量;最后對(duì)低維特征向量進(jìn)行歸一化處理,得到所述答案與所述查詢語(yǔ)句的匹配度;根據(jù)預(yù)設(shè)的過(guò)濾條件過(guò)濾所述匹配度相應(yīng)的輸入文本。本申請(qǐng)方法按照答案與查詢語(yǔ)句的匹配度對(duì)閱讀理解模型訓(xùn)練數(shù)據(jù)進(jìn)行過(guò)濾,優(yōu)化訓(xùn)練數(shù)據(jù),剔除錯(cuò)誤數(shù)據(jù),有利于提升模型性能。