NLP中基于樣本的序列到序列任務(wù)的影響函數(shù)解釋方法
基本信息
申請?zhí)?/td> | CN202210376883.0 | 申請日 | - |
公開(公告)號 | CN114692621A | 公開(公告)日 | 2022-07-01 |
申請公布號 | CN114692621A | 申請公布日 | 2022-07-01 |
分類號 | G06F40/284(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 秦韻;張帆 | 申請(專利權(quán))人 | 南京工業(yè)大學(xué) |
代理機構(gòu) | 南京科闊知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | - |
地址 | 211899江蘇省南京市江北新區(qū)浦珠南路30號 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種NLP中基于樣本的序列到序列任務(wù)的影響函數(shù)解釋方法,包括步驟:1)選取需要獲取解釋的序列到序列任務(wù),并針對序列到序列任務(wù)選取待測的自然語言處理模型和數(shù)據(jù)集;2)將數(shù)據(jù)集內(nèi)的語料進(jìn)行編碼,將編碼后的每條數(shù)據(jù)劃分不同區(qū)間得到的多條數(shù)據(jù)并作為新的樣本;3)將步驟2)得到的新的樣本送入待測模型進(jìn)行訓(xùn)練,在損失趨于穩(wěn)定時結(jié)束訓(xùn)練;在待測模型訓(xùn)練過程輸出的所有檢查點中,選取趨近于待測模型最終參數(shù)的檢查點用于影響分?jǐn)?shù)的計算;4)基于步驟3)選取的檢查點中的待測模型參數(shù),計算訓(xùn)練樣本與測試樣本的損失;5)利用步驟4)得到的樣本損失,基于待測模型參數(shù)計算梯度向量,按照影響函數(shù)公式計算得到影響分?jǐn)?shù)。 |
