一種基于地址編碼和相似計算的地址匹配方法

基本信息

申請?zhí)?/td> CN202110097553.3 申請日 -
公開(公告)號 CN112835894A 公開(公告)日 2021-05-25
申請公布號 CN112835894A 申請公布日 2021-05-25
分類號 G06F16/22;G06F16/242;G06F16/29;G06F40/242;G06F40/289;G06Q50/26 分類 計算;推算;計數(shù);
發(fā)明人 金勇;鄧璇 申請(專利權(quán))人 武漢烽火普天信息技術(shù)有限公司
代理機(jī)構(gòu) 上海精晟知識產(chǎn)權(quán)代理有限公司 代理人 劉寧
地址 430000 湖北省武漢市東湖開發(fā)區(qū)關(guān)山二路附4號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及信息技術(shù)領(lǐng)域,具體為一種基于地址編碼和相似計算的地址匹配方法,包括如下步驟:S1、首先將標(biāo)準(zhǔn)地址庫中已有的“ID?地址要素”的地址編碼進(jìn)行重構(gòu)建,構(gòu)成自定義詞典;S2、基于自定義詞典與新地址庫依賴地對原始標(biāo)準(zhǔn)地址庫進(jìn)行數(shù)據(jù)初步過濾篩選;S3、通過地址標(biāo)準(zhǔn)化模塊對數(shù)字轉(zhuǎn)換、數(shù)字中文的分開提取與地址層級歸一化處理;S4、地址匹配模塊對提取的中文和數(shù)字分別基于WMD算法和最小編輯距離算法對數(shù)據(jù)進(jìn)行加權(quán)匹配,返回準(zhǔn)確度最高的標(biāo)準(zhǔn)地址庫信息。本發(fā)明加快了匹配速度。增加了算法的準(zhǔn)確度解決了稀疏詞向量導(dǎo)致的內(nèi)存不夠的問題,也避免了大量無效匹配值的產(chǎn)生。