一種對話數(shù)據(jù)中問答對的抽取方法

基本信息

申請?zhí)?/td> CN202111652551.2 申請日 -
公開(公告)號 CN114281975A 公開(公告)日 2022-04-05
申請公布號 CN114281975A 申請公布日 2022-04-05
分類號 G06F16/332(2019.01)I;G06F40/30(2020.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 趙繼帆;梁龍 申請(專利權(quán))人 北京塵鋒信息技術(shù)有限公司
代理機構(gòu) 北京東靈通專利代理事務(wù)所(普通合伙) 代理人 李金豹
地址 100020北京市朝陽區(qū)安立路78、80號05層501內(nèi)506室
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于客服問答技術(shù)領(lǐng)域,尤其是一種對話數(shù)據(jù)中問答對的抽取方法,包括DusBERT模型,所述DusBERT模型是對原始BERT模型進行裁剪后,并在對話數(shù)據(jù)上進行再訓(xùn)練的預(yù)訓(xùn)練模型,且DusBERT模型包括有數(shù)據(jù)分析單元,數(shù)據(jù)預(yù)處理單元、數(shù)據(jù)訓(xùn)練單元、數(shù)據(jù)分析單元、數(shù)據(jù)預(yù)測單元和數(shù)據(jù)評估單元,所述數(shù)據(jù)分析單元具體包括以下步驟:S11:首先將對話數(shù)據(jù)通過滑動窗口的方式對數(shù)據(jù)進行切分,進行數(shù)據(jù)分析。本發(fā)明的網(wǎng)絡(luò)架構(gòu)計算過程可完全并行,在大量會話數(shù)據(jù)的情況下,性能可以保障;網(wǎng)絡(luò)充分考慮上下文,對于簡略的問題,例如“為什么”可以從文中獲取信息,從而對定位答案有比較大的幫助。