基于敏感詞的聊天內(nèi)容審核方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201810439750.7 | 申請日 | - |
公開(公告)號 | CN108647309B | 公開(公告)日 | 2021-08-10 |
申請公布號 | CN108647309B | 申請公布日 | 2021-08-10 |
分類號 | G06F16/33;G06F16/35;G06F40/289 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 周顥鈺;文輝;紀達麒;陳運文 | 申請(專利權(quán))人 | 達觀數(shù)據(jù)有限公司 |
代理機構(gòu) | 北京知果之信知識產(chǎn)權(quán)代理有限公司 | 代理人 | 唐海力;李志剛 |
地址 | 201203 上海市浦東新區(qū)亮秀路112號Y1座515室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種基于敏感詞的聊天內(nèi)容審核方法及系統(tǒng)。該聊天內(nèi)容審核方法包括:將敏感詞詞庫劃分成包含行話集合的至少兩個敏感詞集合;將每個所述敏感詞集合與文本庫進行匹配,生成每個所述敏感詞集合對應(yīng)的文本集合;將所述文本集合中的文本作為訓(xùn)練材料進行機器學(xué)習(xí)處理,生成每個所述敏感詞集合對應(yīng)的分類審核模型;將待審核的文本送入一個或多個分類審核模型中進行審核,并得出審核結(jié)果。本申請解決了解決現(xiàn)有的文本審核系統(tǒng)僅通過關(guān)鍵詞對比進行審核容易導(dǎo)致誤判,以及無法及時有效的的對新詞、行話做出反應(yīng)的問題。 |
