一種會話場景信息抽取方法

基本信息

申請?zhí)?/td> CN202111652512.2 申請日 -
公開(公告)號 CN114328926A 公開(公告)日 2022-04-12
申請公布號 CN114328926A 申請公布日 2022-04-12
分類號 G06F16/35(2019.01)I;G06F16/332(2019.01)I;G06F16/33(2019.01)I;G06F40/30(2020.01)I;G06F40/295(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 趙繼帆;譚波 申請(專利權(quán))人 北京塵鋒信息技術(shù)有限公司
代理機構(gòu) 北京東靈通專利代理事務(wù)所(普通合伙) 代理人 李金豹
地址 100020北京市朝陽區(qū)安立路78、80號05層501內(nèi)506室
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于信息人工智能技術(shù)領(lǐng)域,尤其是一種會話場景信息抽取方法,針對會話文本中干擾信息較多的問題,現(xiàn)提出以下方案,包括BERT,其特征在于,所述BERT包括utterance分類單元、utterance處理單元、utterance訓(xùn)練單元、utterance再處理單元和utterance預(yù)測單元,所述utterance分類單元是用于對問答雙方的utterances進行分類以及信息類別匹配,所述utterance處理單元是加入適當(dāng)標(biāo)記并捕獲語義編碼,同時將窗口數(shù)據(jù)格式化,所述utterance訓(xùn)練單元是通過編碼分類utterances。本發(fā)明通過從粗到細、粗細結(jié)合的方法保證了抽取信息的準(zhǔn)確性。