一種語(yǔ)料混淆處理方法、裝置及介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202011438908.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112507093A 公開(kāi)(公告)日 2021-03-16
申請(qǐng)公布號(hào) CN112507093A 申請(qǐng)公布日 2021-03-16
分類號(hào) G06N3/04(2006.01)I;G06F16/33(2019.01)I;G06N3/08(2006.01)I;G06F16/332(2019.01)I;G06F40/216(2020.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 尤翔遠(yuǎn);周玉立;王剛;劉俊杰;沈懿忱;陳達(dá) 申請(qǐng)(專利權(quán))人 稅友軟件集團(tuán)股份有限公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 丁曼曼
地址 310053浙江省杭州市濱江區(qū)浦沿街道南環(huán)路3738號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開(kāi)了一種語(yǔ)料混淆處理方法包括獲取待處理數(shù)據(jù),從初始用戶問(wèn)中剔除存在混淆的用戶問(wèn),而保留不存在混淆的用戶問(wèn)作為目標(biāo)用戶問(wèn);再將目標(biāo)用戶問(wèn)和對(duì)應(yīng)的目標(biāo)標(biāo)準(zhǔn)問(wèn)作為訓(xùn)練樣本對(duì)所調(diào)用的分類模型進(jìn)行訓(xùn)練;最后基于訓(xùn)練結(jié)果對(duì)目標(biāo)用戶問(wèn)和目標(biāo)標(biāo)準(zhǔn)問(wèn)進(jìn)行修復(fù),直到訓(xùn)練結(jié)果滿足預(yù)設(shè)要求為止。由此可見(jiàn),應(yīng)用于以上技術(shù)方案,通過(guò)對(duì)用戶問(wèn)進(jìn)行篩選,可以發(fā)現(xiàn)并修復(fù)誤標(biāo)注的問(wèn)題,從而提高訓(xùn)練樣本的質(zhì)量,進(jìn)而提高分類模型的預(yù)測(cè)結(jié)果的準(zhǔn)確性。此外本申請(qǐng)所公開(kāi)的語(yǔ)料混淆處理裝置及介質(zhì),與上述方法對(duì)應(yīng),效果同上。??