NLP中基于樣本的序列到序列任務(wù)的影響函數(shù)解釋方法

基本信息

申請?zhí)?/td> CN202210376883.0 申請日 -
公開(公告)號 CN114692621A 公開(公告)日 2022-07-01
申請公布號 CN114692621A 申請公布日 2022-07-01
分類號 G06F40/284(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 秦韻;張帆 申請(專利權(quán))人 南京工業(yè)大學(xué)
代理機構(gòu) 南京科闊知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 -
地址 211899江蘇省南京市江北新區(qū)浦珠南路30號
法律狀態(tài) -

摘要

摘要 一種NLP中基于樣本的序列到序列任務(wù)的影響函數(shù)解釋方法,包括步驟:1)選取需要獲取解釋的序列到序列任務(wù),并針對序列到序列任務(wù)選取待測的自然語言處理模型和數(shù)據(jù)集;2)將數(shù)據(jù)集內(nèi)的語料進(jìn)行編碼,將編碼后的每條數(shù)據(jù)劃分不同區(qū)間得到的多條數(shù)據(jù)并作為新的樣本;3)將步驟2)得到的新的樣本送入待測模型進(jìn)行訓(xùn)練,在損失趨于穩(wěn)定時結(jié)束訓(xùn)練;在待測模型訓(xùn)練過程輸出的所有檢查點中,選取趨近于待測模型最終參數(shù)的檢查點用于影響分?jǐn)?shù)的計算;4)基于步驟3)選取的檢查點中的待測模型參數(shù),計算訓(xùn)練樣本與測試樣本的損失;5)利用步驟4)得到的樣本損失,基于待測模型參數(shù)計算梯度向量,按照影響函數(shù)公式計算得到影響分?jǐn)?shù)。