一種串并案識(shí)別方法

基本信息

申請(qǐng)?zhí)?/td> CN201610631053.2 申請(qǐng)日 -
公開(公告)號(hào) CN106294319A 公開(公告)日 2017-01-04
申請(qǐng)公布號(hào) CN106294319A 申請(qǐng)公布日 2017-01-04
分類號(hào) G06F17/27(2006.01)I;G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鄭勝;夏明;徐濤;張勝;周可;蔣丹 申請(qǐng)(專利權(quán))人 武漢數(shù)為科技有限公司
代理機(jī)構(gòu) 武漢東喻專利代理事務(wù)所(普通合伙) 代理人 方可
地址 430074 湖北省武漢市東湖高新區(qū)光谷大道3號(hào)未來之光3棟11層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種串并案識(shí)別方法及系統(tǒng),其方法包括預(yù)處理步驟,對(duì)案件的案情描述進(jìn)行分詞與詞性標(biāo)注,并去除停用詞;對(duì)預(yù)處理后的案情描述,通過基于規(guī)則和字典相結(jié)合的方法提取案件的重要特征,將案件文本轉(zhuǎn)化成特征向量;根據(jù)特征向量,采用案件特征相似度計(jì)算方法獲得案件的綜合相似度,通過綜合相似度進(jìn)行聚類,找到相關(guān)案件的密集簇,識(shí)別出串并案件;通過本發(fā)明提供的方法及系統(tǒng),基于特征密度進(jìn)行聚類,改進(jìn)了傳統(tǒng)聚類算法應(yīng)用于數(shù)值型向量的局限性;克服了從案情文本庫獲取可能的串并案簇的難點(diǎn);將該方法及系統(tǒng)應(yīng)用于案件偵查可提高偵查效率。