一種基于地址編碼和相似計算的地址匹配方法
基本信息
申請?zhí)?/td> | CN202110097553.3 | 申請日 | - |
公開(公告)號 | CN112835894A | 公開(公告)日 | 2021-05-25 |
申請公布號 | CN112835894A | 申請公布日 | 2021-05-25 |
分類號 | G06F16/22;G06F16/242;G06F16/29;G06F40/242;G06F40/289;G06Q50/26 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 金勇;鄧璇 | 申請(專利權(quán))人 | 武漢烽火普天信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 上海精晟知識產(chǎn)權(quán)代理有限公司 | 代理人 | 劉寧 |
地址 | 430000 湖北省武漢市東湖開發(fā)區(qū)關(guān)山二路附4號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及信息技術(shù)領(lǐng)域,具體為一種基于地址編碼和相似計算的地址匹配方法,包括如下步驟:S1、首先將標(biāo)準(zhǔn)地址庫中已有的“ID?地址要素”的地址編碼進(jìn)行重構(gòu)建,構(gòu)成自定義詞典;S2、基于自定義詞典與新地址庫依賴地對原始標(biāo)準(zhǔn)地址庫進(jìn)行數(shù)據(jù)初步過濾篩選;S3、通過地址標(biāo)準(zhǔn)化模塊對數(shù)字轉(zhuǎn)換、數(shù)字中文的分開提取與地址層級歸一化處理;S4、地址匹配模塊對提取的中文和數(shù)字分別基于WMD算法和最小編輯距離算法對數(shù)據(jù)進(jìn)行加權(quán)匹配,返回準(zhǔn)確度最高的標(biāo)準(zhǔn)地址庫信息。本發(fā)明加快了匹配速度。增加了算法的準(zhǔn)確度解決了稀疏詞向量導(dǎo)致的內(nèi)存不夠的問題,也避免了大量無效匹配值的產(chǎn)生。 |
