基于多個數(shù)據(jù)源的自然人數(shù)據(jù)處理方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201711088455.3 申請日 -
公開(公告)號 CN107862047B 公開(公告)日 2018-03-30
申請公布號 CN107862047B 申請公布日 2018-03-30
分類號 G06F16/901(2019.01)I 分類 -
發(fā)明人 錢志龍;朱俊贏;馮磊;管大業(yè);徐兆鵬 申請(專利權(quán))人 愛財科技集團有限公司
代理機構(gòu) 杭州裕陽聯(lián)合專利代理有限公司 代理人 愛財科技有限公司
地址 310000浙江省杭州市西湖區(qū)華星路96號3幢504室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于多個數(shù)據(jù)源的自然人數(shù)據(jù)處理方法和系統(tǒng),其中方法包括對多個數(shù)據(jù)源的自然人數(shù)據(jù)表的用戶數(shù)據(jù)中添加唯一編號信息和加入當前時間信息,得到用戶時間編碼數(shù)據(jù);根據(jù)列表列名信息對數(shù)據(jù)源兩兩進行并行處理,得到自然人數(shù)據(jù)表內(nèi)列表列名的相似度信息;在當前時間,根據(jù)圖中的相似度信息和預設閾值將數(shù)據(jù)源進行合并,同時將合并的自然人數(shù)據(jù)表所有時間對應的用戶時間編碼數(shù)據(jù)按照編碼極值分配為超級身份標識;最后根據(jù)超級身份標識對自然人數(shù)據(jù)表進行回溯處理得到多個數(shù)據(jù)源歸類后的自然人信息表。本發(fā)明有效避免了相同超級身份標識的產(chǎn)生;減少后續(xù)數(shù)據(jù)處理對資源造成的浪費,而且提高數(shù)據(jù)處理效率,簡化自然人識別的計算復雜度。??