一種敏感文本識別的系統(tǒng)和方法
基本信息
申請?zhí)?/td> | CN202011034790.7 | 申請日 | - |
公開(公告)號 | CN112183087A | 公開(公告)日 | 2021-01-05 |
申請公布號 | CN112183087A | 申請公布日 | 2021-01-05 |
分類號 | G06F40/284(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 廖巍;郭梓軒;韓敏;劉紅宇 | 申請(專利權(quán))人 | 武漢華工安鼎信息技術(shù)有限責(zé)任公司 |
代理機構(gòu) | 北京匯澤知識產(chǎn)權(quán)代理有限公司 | 代理人 | 武漢華工安鼎信息技術(shù)有限責(zé)任公司 |
地址 | 430000湖北省武漢市東湖新技術(shù)開發(fā)區(qū)金融港一路7號神州數(shù)碼武漢科技園15棟1-4層02室-2 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種敏感文本識別的系統(tǒng),包括:分詞模塊、文檔和索引模塊、敏感內(nèi)容相似度評分模塊、文檔匹配模塊、上層管理模塊;本發(fā)明提出的一種敏感文本識別的系統(tǒng),一方面對敏感詞的細粒度拆分,會大大減少一些干擾因素對敏感信息判定的干擾,當(dāng)有多個單字與敏感詞中的單字雷同的情況時,會使該文檔的敏感詞相似度打分上升,從而更容易鑒別出包含隱藏敏感信息的文檔。另一方面,本發(fā)明方便用戶對多個文檔的敏感情況進行評估,同時在用戶想了解詳細情況的時候,能通過文檔匹配模塊對敏感信息進行定位,方便尋找和判定,大大提高了敏感詞檢索技術(shù)的可用性,使之能夠成為保密行業(yè)多種軟件產(chǎn)品可以依賴的一種重要的保密工具。?? |
