一種地址字符串的分詞方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202011522142.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112256932B | 公開(公告)日 | 2021-04-09 |
申請(qǐng)公布號(hào) | CN112256932B | 申請(qǐng)公布日 | 2021-04-09 |
分類號(hào) | G06Q30/00(2012.01)I;G06F40/289(2020.01)I;G06F40/216(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 侯建;黃峰;費(fèi)春勇 | 申請(qǐng)(專利權(quán))人 | 中博信息技術(shù)研究院有限公司 |
代理機(jī)構(gòu) | 常州佰業(yè)騰飛專利代理事務(wù)所(普通合伙) | 代理人 | 張勵(lì) |
地址 | 210000江蘇省南京市雨花臺(tái)區(qū)小行尤家凹08號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種地址字符串的分詞方法及裝置,根據(jù)基礎(chǔ)地址庫(kù)的數(shù)據(jù),使用隱馬爾可夫模型HMM對(duì)地址字符串進(jìn)行狀態(tài)預(yù)測(cè);使用平滑優(yōu)化算法提升狀態(tài)預(yù)測(cè)的準(zhǔn)確率;將概率最大的狀態(tài)預(yù)測(cè)的結(jié)果轉(zhuǎn)換為具體的地址信息。本申請(qǐng)以HMM模型作為基礎(chǔ),將長(zhǎng)地址字符串視為一個(gè)觀測(cè)序列,通過(guò)學(xué)習(xí)基礎(chǔ)地址庫(kù)中的狀態(tài)轉(zhuǎn)移規(guī)律,得出一個(gè)適用于中文地址分詞標(biāo)注的模型,并采用了平滑優(yōu)化算法提升預(yù)測(cè)的準(zhǔn)確率,計(jì)算結(jié)果可以得出該地址的狀態(tài)序列,將概率最大的結(jié)果作為最終的地址分詞方案,降低了人力時(shí)間成本,提升了效率。該方法不僅適用于電信領(lǐng)域的智能客服系統(tǒng),還適用于其他具有地址分詞相似場(chǎng)景的垂直領(lǐng)域。?? |
