一種醫(yī)療數(shù)據(jù)查重和關聯(lián)的方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201710153199.5 申請日 -
公開(公告)號 CN106934038B 公開(公告)日 2018-01-05
申請公布號 CN106934038B 申請公布日 2018-01-05
分類號 G06F17/30(2006.01)I;G06F19/00(2011.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉勁松;王友柱;饒江;李廣東;李楠;王東;陳桂太 申請(專利權)人 江蘇華生基因數(shù)據(jù)科技股份有限公司
代理機構 北京精金石專利代理事務所(普通合伙) 代理人 江蘇華生基因數(shù)據(jù)科技股份有限公司
地址 224007 江蘇省鹽城市經(jīng)濟技術開發(fā)區(qū)希望大道南路5號4幢1401室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種醫(yī)療數(shù)據(jù)查重和關聯(lián)的處理方法及系統(tǒng),所述方法包括(1)提取待處理的醫(yī)療數(shù)據(jù)中的核心數(shù)據(jù)項;(2)將核心數(shù)據(jù)項分類;(3)分別對排除數(shù)組及模糊數(shù)組中的各個數(shù)據(jù)項初步篩查;(4)對核心數(shù)據(jù)項中的各項數(shù)據(jù)項進行深度篩查;(5)設定疑似重復數(shù)據(jù)相似度的閾值M2和/或疑似關聯(lián)數(shù)據(jù)的閾值M3;(6)人工核查疑似重復和/或關聯(lián)數(shù)據(jù)并給予判斷后,將被判斷為不重復的數(shù)據(jù)輸入醫(yī)療數(shù)據(jù)庫中,并給予判斷為存在關聯(lián)的數(shù)據(jù)一個或多個相應的關聯(lián)標簽。本發(fā)明與現(xiàn)有技術相比具有漏判率低、錯判率低、查重效率高的特點,對人工核查的人工專業(yè)度要求不高,因此查重和關聯(lián)的運行成本顯著降低。