一種降低敏感詞諧音匹配誤警率的文本審核裝置及方法

基本信息

申請?zhí)?/td> CN202011336483.4 申請日 -
公開(公告)號 CN112434523A 公開(公告)日 2021-03-02
申請公布號 CN112434523A 申請公布日 2021-03-02
分類號 G06F40/284(2020.01)I;G06F40/30(2020.01)I;G06F40/253(2020.01)I;G06F16/33(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王曉平 申請(專利權(quán))人 上海極鏈科技發(fā)展集團(tuán)有限公司
代理機構(gòu) 上海碩力知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 林曉青
地址 202150上海市崇明區(qū)中興鎮(zhèn)汲浜公路39號21號樓1103室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種降低敏感詞諧音匹配誤警率的文本審核裝置及方法,該裝置包括:特定詞語單元替換模塊,對包含敏感諧音詞的待審核文本,將其敏感諧音詞替換為敏感詞原型,得到替換后的替換文本;分詞模塊,對待審核文本及替換文本進(jìn)行中文分詞處理,分別輸出分詞單元位置索引列表;語法單元一致性審核模塊,根據(jù)待審核文本及替換文本的分詞單元位置索引列表,進(jìn)行替換前后的語法單元一致性審核;詞性標(biāo)注模塊,對具有語法單元一致性的待審核文本及替換文本分別進(jìn)行詞性標(biāo)注處理;詞性標(biāo)注一致性審核模塊,對詞性標(biāo)注結(jié)果,比較特定詞語單元替換前后的詞語詞性;審核結(jié)果判斷輸出模塊,根據(jù)詞性標(biāo)注一致性審核模塊的審核結(jié)果進(jìn)行相應(yīng)的判斷處理。??