一種對話數(shù)據(jù)中問答對的抽取方法
基本信息
申請?zhí)?/td> | CN202111652551.2 | 申請日 | - |
公開(公告)號 | CN114281975A | 公開(公告)日 | 2022-04-05 |
申請公布號 | CN114281975A | 申請公布日 | 2022-04-05 |
分類號 | G06F16/332(2019.01)I;G06F40/30(2020.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 趙繼帆;梁龍 | 申請(專利權(quán))人 | 北京塵鋒信息技術(shù)有限公司 |
代理機構(gòu) | 北京東靈通專利代理事務(wù)所(普通合伙) | 代理人 | 李金豹 |
地址 | 100020北京市朝陽區(qū)安立路78、80號05層501內(nèi)506室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于客服問答技術(shù)領(lǐng)域,尤其是一種對話數(shù)據(jù)中問答對的抽取方法,包括DusBERT模型,所述DusBERT模型是對原始BERT模型進行裁剪后,并在對話數(shù)據(jù)上進行再訓(xùn)練的預(yù)訓(xùn)練模型,且DusBERT模型包括有數(shù)據(jù)分析單元,數(shù)據(jù)預(yù)處理單元、數(shù)據(jù)訓(xùn)練單元、數(shù)據(jù)分析單元、數(shù)據(jù)預(yù)測單元和數(shù)據(jù)評估單元,所述數(shù)據(jù)分析單元具體包括以下步驟:S11:首先將對話數(shù)據(jù)通過滑動窗口的方式對數(shù)據(jù)進行切分,進行數(shù)據(jù)分析。本發(fā)明的網(wǎng)絡(luò)架構(gòu)計算過程可完全并行,在大量會話數(shù)據(jù)的情況下,性能可以保障;網(wǎng)絡(luò)充分考慮上下文,對于簡略的問題,例如“為什么”可以從文中獲取信息,從而對定位答案有比較大的幫助。 |
