一種醫(yī)療數(shù)據(jù)查重和關聯(lián)的方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201710153199.5 | 申請日 | - |
公開(公告)號 | CN106934038B | 公開(公告)日 | 2018-01-05 |
申請公布號 | CN106934038B | 申請公布日 | 2018-01-05 |
分類號 | G06F17/30(2006.01)I;G06F19/00(2011.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 劉勁松;王友柱;饒江;李廣東;李楠;王東;陳桂太 | 申請(專利權)人 | 江蘇華生基因數(shù)據(jù)科技股份有限公司 |
代理機構 | 北京精金石專利代理事務所(普通合伙) | 代理人 | 江蘇華生基因數(shù)據(jù)科技股份有限公司 |
地址 | 224007 江蘇省鹽城市經(jīng)濟技術開發(fā)區(qū)希望大道南路5號4幢1401室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種醫(yī)療數(shù)據(jù)查重和關聯(lián)的處理方法及系統(tǒng),所述方法包括(1)提取待處理的醫(yī)療數(shù)據(jù)中的核心數(shù)據(jù)項;(2)將核心數(shù)據(jù)項分類;(3)分別對排除數(shù)組及模糊數(shù)組中的各個數(shù)據(jù)項初步篩查;(4)對核心數(shù)據(jù)項中的各項數(shù)據(jù)項進行深度篩查;(5)設定疑似重復數(shù)據(jù)相似度的閾值M2和/或疑似關聯(lián)數(shù)據(jù)的閾值M3;(6)人工核查疑似重復和/或關聯(lián)數(shù)據(jù)并給予判斷后,將被判斷為不重復的數(shù)據(jù)輸入醫(yī)療數(shù)據(jù)庫中,并給予判斷為存在關聯(lián)的數(shù)據(jù)一個或多個相應的關聯(lián)標簽。本發(fā)明與現(xiàn)有技術相比具有漏判率低、錯判率低、查重效率高的特點,對人工核查的人工專業(yè)度要求不高,因此查重和關聯(lián)的運行成本顯著降低。 |
