基于商圈劃分的企業(yè)線下與線上多源數(shù)據(jù)整合方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110287069.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112783963A 公開(kāi)(公告)日 2021-05-11
申請(qǐng)公布號(hào) CN112783963A 申請(qǐng)公布日 2021-05-11
分類號(hào) G06F16/25;G06F16/958;G06F40/284;G06Q30/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 譚繼軍;李陽(yáng);謝蓬蓮 申請(qǐng)(專利權(quán))人 上海數(shù)喆數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 成都嘉企源知識(shí)產(chǎn)權(quán)代理有限公司 代理人 何朝友
地址 200000 上海市楊浦區(qū)國(guó)和路60號(hào)(集中登記地)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于商圈劃分的企業(yè)線下與線上多源數(shù)據(jù)整合方法,包括下述幾個(gè)階段:第一階段:對(duì)線上的百萬(wàn)級(jí)樣本數(shù)據(jù)進(jìn)行商圈匹配,主要完成將大量的抓取樣本放入特定商圈的工作,以便降低下一步匹配樣本所在商場(chǎng)的計(jì)算量,提高匹配效率和精度;第二階段:對(duì)各個(gè)1級(jí)商圈進(jìn)行操作,將每個(gè)樣本在某些商圈的可能性做出預(yù)測(cè),并對(duì)可能的1.5級(jí)商圈進(jìn)行排序匹配;第三階段:分別就地址、商戶名和門牌號(hào)綜合計(jì)算相似性得分匹配。本發(fā)明將線上的企業(yè)數(shù)據(jù)與線下的經(jīng)營(yíng)實(shí)體對(duì)應(yīng),拓寬了企業(yè)信息的維度,通過(guò)程序化的方法,減輕了人工匹配的工作量;另外,本發(fā)明還提供一種基于商圈劃分的企業(yè)線下與線上多源數(shù)據(jù)整合裝置,便于實(shí)現(xiàn)多源數(shù)據(jù)的整合。