地址標(biāo)準(zhǔn)化方法、系統(tǒng)及電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202011349668.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112417812A 公開(kāi)(公告)日 2021-02-26
申請(qǐng)公布號(hào) CN112417812A 申請(qǐng)公布日 2021-02-26
分類號(hào) G06F40/103(2020.01)I;G06F16/33(2019.01)I;G06F16/31(2019.01)I;G06F40/151(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 元方;張凡超 申請(qǐng)(專利權(quán))人 新智認(rèn)知數(shù)據(jù)服務(wù)有限公司
代理機(jī)構(gòu) 上海遠(yuǎn)同律師事務(wù)所 代理人 許力;張堅(jiān)
地址 201209上海市浦東新區(qū)川沙路955號(hào)11幢221室
法律狀態(tài) -

摘要

摘要 一種地址標(biāo)準(zhǔn)化方法、系統(tǒng)及電子設(shè)備,本發(fā)明將待標(biāo)準(zhǔn)化地址字符串轉(zhuǎn)為拼音字符組,與糾錯(cuò)詞集合匹配,得到相應(yīng)的中文詞集合,在關(guān)鍵詞集合中查詢中文詞集合中的各中文詞,形成關(guān)鍵中文詞集合,中文詞數(shù)量記為size_cn_keys,對(duì)關(guān)鍵中文詞集合中的每個(gè)中文詞進(jìn)行召回操作,形成第一集合,統(tǒng)計(jì)第一集合中的每個(gè)標(biāo)準(zhǔn)地址字符串包含中文詞集合中不重復(fù)中文詞的數(shù)量size_in,將滿足size_in/size_cn_keys≧閾值的相應(yīng)標(biāo)準(zhǔn)地址字符串加入第二集合,若第二集合中size_in/size_cn_keys的最大值的標(biāo)準(zhǔn)地址字符串只有一條且該最大值為1時(shí),則該標(biāo)準(zhǔn)地址字符串即為待標(biāo)準(zhǔn)化的地址字符串的標(biāo)準(zhǔn)地址,否則,通過(guò)相似度匹配,得到待標(biāo)準(zhǔn)化的地址字符串的標(biāo)準(zhǔn)地址。本發(fā)明可以準(zhǔn)確并且快速地實(shí)現(xiàn)地址標(biāo)準(zhǔn)化。??