一種會話意圖智能識別模型的構(gòu)建方法、裝置及設(shè)備
基本信息
申請?zhí)?/td> | CN202010968430.8 | 申請日 | - |
公開(公告)號 | CN112131890A | 公開(公告)日 | 2020-12-25 |
申請公布號 | CN112131890A | 申請公布日 | 2020-12-25 |
分類號 | G06F40/35(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 周鵬飛;馬亮 | 申請(專利權(quán))人 | 北京慧辰資道資訊股份有限公司 |
代理機(jī)構(gòu) | 北京壹川鳴知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 林潮 |
地址 | 100089北京市海淀區(qū)知春路甲48號2號樓20層20B室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明適用大數(shù)據(jù)人工智能技術(shù)領(lǐng)域,提供會話意圖智能識別模型的構(gòu)建方法、裝置及設(shè)備,包括:獲取語料數(shù)據(jù),所述語料數(shù)據(jù)包括已標(biāo)注語料數(shù)據(jù)以及未標(biāo)注語料數(shù)據(jù);根據(jù)已標(biāo)注語料數(shù)據(jù)以及預(yù)設(shè)的語義分析算法,對未標(biāo)注語料數(shù)據(jù)進(jìn)行處理,生成有標(biāo)簽信息的意圖語料數(shù)據(jù);根據(jù)意圖語料數(shù)據(jù),對預(yù)設(shè)的初始意圖識別模型進(jìn)行迭代訓(xùn)練,構(gòu)建目標(biāo)意圖識別模型。本發(fā)明利用大量無標(biāo)注語料數(shù)據(jù),基于預(yù)設(shè)的語義分析算法,實(shí)現(xiàn)訓(xùn)練語料半自動(dòng)標(biāo)注,僅需少量糾正即可完成大規(guī)模語料標(biāo)注過程,降低語料標(biāo)注成本;另外,將語料標(biāo)注、模型優(yōu)化問題作為一個(gè)統(tǒng)一任務(wù)進(jìn)行迭代,實(shí)現(xiàn)意圖識別模型生成過程中人工干預(yù)最小化、解決數(shù)據(jù)標(biāo)注耗時(shí)、模型訓(xùn)練困難的問題。?? |
