基于多個(gè)數(shù)據(jù)源的自然人數(shù)據(jù)處理方法和系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201711088455.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN107862047A | 公開(kāi)(公告)日 | 2018-03-30 |
申請(qǐng)公布號(hào) | CN107862047A | 申請(qǐng)公布日 | 2018-03-30 |
分類號(hào) | G06F17/30 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 錢志龍;朱俊贏;馮磊;管大業(yè);徐兆鵬 | 申請(qǐng)(專利權(quán))人 | 愛(ài)財(cái)科技集團(tuán)有限公司 |
代理機(jī)構(gòu) | 杭州知通專利代理事務(wù)所(普通合伙) | 代理人 | 愛(ài)財(cái)科技有限公司 |
地址 | 310000 浙江省杭州市西湖區(qū)華星路96號(hào)3幢504室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于多個(gè)數(shù)據(jù)源的自然人數(shù)據(jù)處理方法和系統(tǒng),其中方法包括對(duì)多個(gè)數(shù)據(jù)源的自然人數(shù)據(jù)表的用戶數(shù)據(jù)中添加唯一編號(hào)信息和加入當(dāng)前時(shí)間信息,得到用戶時(shí)間編碼數(shù)據(jù);根據(jù)列表列名信息對(duì)數(shù)據(jù)源兩兩進(jìn)行并行處理,得到自然人數(shù)據(jù)表內(nèi)列表列名的相似度信息;在當(dāng)前時(shí)間,根據(jù)圖中的相似度信息和預(yù)設(shè)閾值將數(shù)據(jù)源進(jìn)行合并,同時(shí)將合并的自然人數(shù)據(jù)表所有時(shí)間對(duì)應(yīng)的用戶時(shí)間編碼數(shù)據(jù)按照編碼極值分配為超級(jí)身份標(biāo)識(shí);最后根據(jù)超級(jí)身份標(biāo)識(shí)對(duì)自然人數(shù)據(jù)表進(jìn)行回溯處理得到多個(gè)數(shù)據(jù)源歸類后的自然人信息表。本發(fā)明有效避免了相同超級(jí)身份標(biāo)識(shí)的產(chǎn)生;減少后續(xù)數(shù)據(jù)處理對(duì)資源造成的浪費(fèi),而且提高數(shù)據(jù)處理效率,簡(jiǎn)化自然人識(shí)別的計(jì)算復(fù)雜度。 |
