一種敏感文本識(shí)別的系統(tǒng)和方法
基本信息
申請(qǐng)?zhí)?/td> | CN202011034790.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112183087A | 公開(kāi)(公告)日 | 2021-01-05 |
申請(qǐng)公布號(hào) | CN112183087A | 申請(qǐng)公布日 | 2021-01-05 |
分類號(hào) | G06F40/284(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 廖巍;郭梓軒;韓敏;劉紅宇 | 申請(qǐng)(專利權(quán))人 | 武漢華工安鼎信息技術(shù)有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京匯澤知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 武漢華工安鼎信息技術(shù)有限責(zé)任公司 |
地址 | 430000湖北省武漢市東湖新技術(shù)開(kāi)發(fā)區(qū)金融港一路7號(hào)神州數(shù)碼武漢科技園15棟1-4層02室-2 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種敏感文本識(shí)別的系統(tǒng),包括:分詞模塊、文檔和索引模塊、敏感內(nèi)容相似度評(píng)分模塊、文檔匹配模塊、上層管理模塊;本發(fā)明提出的一種敏感文本識(shí)別的系統(tǒng),一方面對(duì)敏感詞的細(xì)粒度拆分,會(huì)大大減少一些干擾因素對(duì)敏感信息判定的干擾,當(dāng)有多個(gè)單字與敏感詞中的單字雷同的情況時(shí),會(huì)使該文檔的敏感詞相似度打分上升,從而更容易鑒別出包含隱藏敏感信息的文檔。另一方面,本發(fā)明方便用戶對(duì)多個(gè)文檔的敏感情況進(jìn)行評(píng)估,同時(shí)在用戶想了解詳細(xì)情況的時(shí)候,能通過(guò)文檔匹配模塊對(duì)敏感信息進(jìn)行定位,方便尋找和判定,大大提高了敏感詞檢索技術(shù)的可用性,使之能夠成為保密行業(yè)多種軟件產(chǎn)品可以依賴的一種重要的保密工具。?? |
