基于多個數(shù)據(jù)源的自然人數(shù)據(jù)處理方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN201711088455.3 | 申請日 | - |
公開(公告)號 | CN107862047B | 公開(公告)日 | 2018-03-30 |
申請公布號 | CN107862047B | 申請公布日 | 2018-03-30 |
分類號 | G06F16/901(2019.01)I | 分類 | - |
發(fā)明人 | 錢志龍;朱俊贏;馮磊;管大業(yè);徐兆鵬 | 申請(專利權(quán))人 | 愛財科技集團有限公司 |
代理機構(gòu) | 杭州裕陽聯(lián)合專利代理有限公司 | 代理人 | 愛財科技有限公司 |
地址 | 310000浙江省杭州市西湖區(qū)華星路96號3幢504室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于多個數(shù)據(jù)源的自然人數(shù)據(jù)處理方法和系統(tǒng),其中方法包括對多個數(shù)據(jù)源的自然人數(shù)據(jù)表的用戶數(shù)據(jù)中添加唯一編號信息和加入當前時間信息,得到用戶時間編碼數(shù)據(jù);根據(jù)列表列名信息對數(shù)據(jù)源兩兩進行并行處理,得到自然人數(shù)據(jù)表內(nèi)列表列名的相似度信息;在當前時間,根據(jù)圖中的相似度信息和預設閾值將數(shù)據(jù)源進行合并,同時將合并的自然人數(shù)據(jù)表所有時間對應的用戶時間編碼數(shù)據(jù)按照編碼極值分配為超級身份標識;最后根據(jù)超級身份標識對自然人數(shù)據(jù)表進行回溯處理得到多個數(shù)據(jù)源歸類后的自然人信息表。本發(fā)明有效避免了相同超級身份標識的產(chǎn)生;減少后續(xù)數(shù)據(jù)處理對資源造成的浪費,而且提高數(shù)據(jù)處理效率,簡化自然人識別的計算復雜度。?? |
