一種語(yǔ)料混淆處理方法、裝置及介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202011438908.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112507093A | 公開(kāi)(公告)日 | 2021-03-16 |
申請(qǐng)公布號(hào) | CN112507093A | 申請(qǐng)公布日 | 2021-03-16 |
分類號(hào) | G06N3/04(2006.01)I;G06F16/33(2019.01)I;G06N3/08(2006.01)I;G06F16/332(2019.01)I;G06F40/216(2020.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 尤翔遠(yuǎn);周玉立;王剛;劉俊杰;沈懿忱;陳達(dá) | 申請(qǐng)(專利權(quán))人 | 稅友軟件集團(tuán)股份有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 丁曼曼 |
地址 | 310053浙江省杭州市濱江區(qū)浦沿街道南環(huán)路3738號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開(kāi)了一種語(yǔ)料混淆處理方法包括獲取待處理數(shù)據(jù),從初始用戶問(wèn)中剔除存在混淆的用戶問(wèn),而保留不存在混淆的用戶問(wèn)作為目標(biāo)用戶問(wèn);再將目標(biāo)用戶問(wèn)和對(duì)應(yīng)的目標(biāo)標(biāo)準(zhǔn)問(wèn)作為訓(xùn)練樣本對(duì)所調(diào)用的分類模型進(jìn)行訓(xùn)練;最后基于訓(xùn)練結(jié)果對(duì)目標(biāo)用戶問(wèn)和目標(biāo)標(biāo)準(zhǔn)問(wèn)進(jìn)行修復(fù),直到訓(xùn)練結(jié)果滿足預(yù)設(shè)要求為止。由此可見(jiàn),應(yīng)用于以上技術(shù)方案,通過(guò)對(duì)用戶問(wèn)進(jìn)行篩選,可以發(fā)現(xiàn)并修復(fù)誤標(biāo)注的問(wèn)題,從而提高訓(xùn)練樣本的質(zhì)量,進(jìn)而提高分類模型的預(yù)測(cè)結(jié)果的準(zhǔn)確性。此外本申請(qǐng)所公開(kāi)的語(yǔ)料混淆處理裝置及介質(zhì),與上述方法對(duì)應(yīng),效果同上。?? |
