一種敏感文本識(shí)別的系統(tǒng)和方法

基本信息

申請(qǐng)?zhí)?/td> CN202011034790.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112183087A 公開(kāi)(公告)日 2021-01-05
申請(qǐng)公布號(hào) CN112183087A 申請(qǐng)公布日 2021-01-05
分類號(hào) G06F40/284(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 廖巍;郭梓軒;韓敏;劉紅宇 申請(qǐng)(專利權(quán))人 武漢華工安鼎信息技術(shù)有限責(zé)任公司
代理機(jī)構(gòu) 北京匯澤知識(shí)產(chǎn)權(quán)代理有限公司 代理人 武漢華工安鼎信息技術(shù)有限責(zé)任公司
地址 430000湖北省武漢市東湖新技術(shù)開(kāi)發(fā)區(qū)金融港一路7號(hào)神州數(shù)碼武漢科技園15棟1-4層02室-2
法律狀態(tài) -

摘要

摘要 一種敏感文本識(shí)別的系統(tǒng),包括:分詞模塊、文檔和索引模塊、敏感內(nèi)容相似度評(píng)分模塊、文檔匹配模塊、上層管理模塊;本發(fā)明提出的一種敏感文本識(shí)別的系統(tǒng),一方面對(duì)敏感詞的細(xì)粒度拆分,會(huì)大大減少一些干擾因素對(duì)敏感信息判定的干擾,當(dāng)有多個(gè)單字與敏感詞中的單字雷同的情況時(shí),會(huì)使該文檔的敏感詞相似度打分上升,從而更容易鑒別出包含隱藏敏感信息的文檔。另一方面,本發(fā)明方便用戶對(duì)多個(gè)文檔的敏感情況進(jìn)行評(píng)估,同時(shí)在用戶想了解詳細(xì)情況的時(shí)候,能通過(guò)文檔匹配模塊對(duì)敏感信息進(jìn)行定位,方便尋找和判定,大大提高了敏感詞檢索技術(shù)的可用性,使之能夠成為保密行業(yè)多種軟件產(chǎn)品可以依賴的一種重要的保密工具。??