一種基于投訴工單訓(xùn)練文本計(jì)算最佳標(biāo)注集的方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202010114158.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111353291A | 公開(公告)日 | 2020-06-30 |
申請(qǐng)公布號(hào) | CN111353291A | 申請(qǐng)公布日 | 2020-06-30 |
分類號(hào) | G06F40/205(2020.01)I | 分類 | - |
發(fā)明人 | 劉博;雷曉宇;王福君;許金偉 | 申請(qǐng)(專利權(quán))人 | 北京合力億捷科技股份有限公司 |
代理機(jī)構(gòu) | 北京久誠知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 北京合力億捷科技股份有限公司 |
地址 | 100081北京市海淀區(qū)中關(guān)村南大街甲12號(hào)寰太大廈18層 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于電信行業(yè)客服投訴工單訓(xùn)練文本計(jì)算最佳標(biāo)注集的方法,選取待標(biāo)注訓(xùn)練樣本后,S1、取樣標(biāo)注一個(gè)樣本;S2、主動(dòng)在線學(xué)習(xí)實(shí)時(shí)更新模型;S3、當(dāng)標(biāo)注數(shù)據(jù)達(dá)到一定數(shù)據(jù)累計(jì)閾值時(shí),使用線下深度學(xué)習(xí)更新模型;S4、模型更新后對(duì)未標(biāo)注池example做預(yù)測;S5、取確信度最低example作為待標(biāo)注樣例;S6、重復(fù)至步驟S1;S7、重復(fù)生成最優(yōu)模型算法后,計(jì)算輸出最佳待標(biāo)注集;S8、對(duì)最佳標(biāo)注集進(jìn)行人工標(biāo)注,從而無需大量標(biāo)注訓(xùn)練樣本。?? |
