一種會話意圖智能識別模型的構(gòu)建方法、裝置及設(shè)備

基本信息

申請?zhí)?/td> CN202010968430.8 申請日 -
公開(公告)號 CN112131890A 公開(公告)日 2020-12-25
申請公布號 CN112131890A 申請公布日 2020-12-25
分類號 G06F40/35(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周鵬飛;馬亮 申請(專利權(quán))人 北京慧辰資道資訊股份有限公司
代理機(jī)構(gòu) 北京壹川鳴知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 林潮
地址 100089北京市海淀區(qū)知春路甲48號2號樓20層20B室
法律狀態(tài) -

摘要

摘要 本發(fā)明適用大數(shù)據(jù)人工智能技術(shù)領(lǐng)域,提供會話意圖智能識別模型的構(gòu)建方法、裝置及設(shè)備,包括:獲取語料數(shù)據(jù),所述語料數(shù)據(jù)包括已標(biāo)注語料數(shù)據(jù)以及未標(biāo)注語料數(shù)據(jù);根據(jù)已標(biāo)注語料數(shù)據(jù)以及預(yù)設(shè)的語義分析算法,對未標(biāo)注語料數(shù)據(jù)進(jìn)行處理,生成有標(biāo)簽信息的意圖語料數(shù)據(jù);根據(jù)意圖語料數(shù)據(jù),對預(yù)設(shè)的初始意圖識別模型進(jìn)行迭代訓(xùn)練,構(gòu)建目標(biāo)意圖識別模型。本發(fā)明利用大量無標(biāo)注語料數(shù)據(jù),基于預(yù)設(shè)的語義分析算法,實(shí)現(xiàn)訓(xùn)練語料半自動(dòng)標(biāo)注,僅需少量糾正即可完成大規(guī)模語料標(biāo)注過程,降低語料標(biāo)注成本;另外,將語料標(biāo)注、模型優(yōu)化問題作為一個(gè)統(tǒng)一任務(wù)進(jìn)行迭代,實(shí)現(xiàn)意圖識別模型生成過程中人工干預(yù)最小化、解決數(shù)據(jù)標(biāo)注耗時(shí)、模型訓(xùn)練困難的問題。??