一種面向大數(shù)據(jù)環(huán)境的通用中文地址匹配方法
基本信息
申請?zhí)?/td> | CN201810970921.9 | 申請日 | - |
公開(公告)號 | CN109165273A | 公開(公告)日 | 2019-01-08 |
申請公布號 | CN109165273A | 申請公布日 | 2019-01-08 |
分類號 | G06F16/31;G06F16/335 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 水新瑩;張宇光;黃亞坤 | 申請(專利權(quán))人 | 安徽訊飛智能科技有限公司 |
代理機(jī)構(gòu) | 蕪湖思誠知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 安徽訊飛智能科技有限公司 |
地址 | 241000 安徽省蕪湖市鳩江區(qū)皖江財(cái)富廣場A1座9樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種面向大數(shù)據(jù)環(huán)境的通用中文地址匹配方法,包括S1、數(shù)據(jù)預(yù)處理;S2、中文地址要素解析,將中文、字母和數(shù)字信息分解提煉出相應(yīng)的要素信息;S3、定義多種距離計(jì)算公式,實(shí)現(xiàn)基于key?value計(jì)算各地址信息之間匹配關(guān)系的多種距離;S4、基于對要素信息完成原始地址字符串的key?value形式轉(zhuǎn)換,建立基于key?value的多種距離匹配模型并由此計(jì)算綜合匹配度,據(jù)此對目標(biāo)地址進(jìn)行排序;S5、綜合匹配度最大值是否大于給定閾值參數(shù),并由此給出匹配結(jié)果。本發(fā)明將單條地址的匹配效率從1min左右降低到約2.2s;匹配結(jié)果在匹配度與精確度指標(biāo)上更均衡,對推動(dòng)智慧城市的構(gòu)建具有較高的應(yīng)用價(jià)值。 |
