基于文本相似度計(jì)算的地址庫(kù)數(shù)據(jù)處理方法和控制系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202111184456.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113836357A 公開(kāi)(公告)日 2021-12-24
申請(qǐng)公布號(hào) CN113836357A 申請(qǐng)公布日 2021-12-24
分類(lèi)號(hào) G06F16/84(2019.01)I;G06F16/31(2019.01)I;G06F16/25(2019.01)I;G06K9/62(2006.01)I;G06Q30/06(2012.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王曉林 申請(qǐng)(專(zhuān)利權(quán))人 北京商越網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 北京市鼎立東審知識(shí)產(chǎn)權(quán)代理有限公司 代理人 陳佳妹;朱慧娟
地址 100000北京市海淀區(qū)農(nóng)大南路1號(hào)院8號(hào)樓4層401-1001
法律狀態(tài) -

摘要

摘要 本申請(qǐng)涉及一種基于文本相似度計(jì)算的地址庫(kù)數(shù)據(jù)處理方法和控制系統(tǒng),通過(guò)獲取第一地址庫(kù)數(shù)據(jù)和第二地址庫(kù)數(shù)據(jù),并根據(jù)所述第一地址庫(kù)數(shù)據(jù)建立按照地址層級(jí)排序的映射數(shù)據(jù)表;根據(jù)所述映射數(shù)據(jù)表,從所述映射數(shù)據(jù)表獲取所有與所述第二地址庫(kù)數(shù)據(jù)中的源地址同級(jí)的映射地址,并將所有映射地址的集合作為地址映射集;將所述第二地址庫(kù)數(shù)中的源地址與所述地址映射集中的每一個(gè)地址進(jìn)行相似度計(jì)算;根據(jù)相似度計(jì)算結(jié)果排序,將相似度最大值的地址作為所述源地址的目標(biāo)地址。通過(guò)相似度計(jì)算,從映射地址表中獲取不同地址層級(jí)的地址信息數(shù)據(jù),將地址進(jìn)行一層轉(zhuǎn)換,精裝且快速的匹配兩個(gè)地址庫(kù),使得轉(zhuǎn)換后的地址可直接應(yīng)用于電商平臺(tái),加快電商交流。