一種地址字符串的分詞方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202011522142.6 申請(qǐng)日 -
公開(公告)號(hào) CN112256932B 公開(公告)日 2021-04-09
申請(qǐng)公布號(hào) CN112256932B 申請(qǐng)公布日 2021-04-09
分類號(hào) G06Q30/00(2012.01)I;G06F40/289(2020.01)I;G06F40/216(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 侯建;黃峰;費(fèi)春勇 申請(qǐng)(專利權(quán))人 中博信息技術(shù)研究院有限公司
代理機(jī)構(gòu) 常州佰業(yè)騰飛專利代理事務(wù)所(普通合伙) 代理人 張勵(lì)
地址 210000江蘇省南京市雨花臺(tái)區(qū)小行尤家凹08號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開了一種地址字符串的分詞方法及裝置,根據(jù)基礎(chǔ)地址庫(kù)的數(shù)據(jù),使用隱馬爾可夫模型HMM對(duì)地址字符串進(jìn)行狀態(tài)預(yù)測(cè);使用平滑優(yōu)化算法提升狀態(tài)預(yù)測(cè)的準(zhǔn)確率;將概率最大的狀態(tài)預(yù)測(cè)的結(jié)果轉(zhuǎn)換為具體的地址信息。本申請(qǐng)以HMM模型作為基礎(chǔ),將長(zhǎng)地址字符串視為一個(gè)觀測(cè)序列,通過(guò)學(xué)習(xí)基礎(chǔ)地址庫(kù)中的狀態(tài)轉(zhuǎn)移規(guī)律,得出一個(gè)適用于中文地址分詞標(biāo)注的模型,并采用了平滑優(yōu)化算法提升預(yù)測(cè)的準(zhǔn)確率,計(jì)算結(jié)果可以得出該地址的狀態(tài)序列,將概率最大的結(jié)果作為最終的地址分詞方案,降低了人力時(shí)間成本,提升了效率。該方法不僅適用于電信領(lǐng)域的智能客服系統(tǒng),還適用于其他具有地址分詞相似場(chǎng)景的垂直領(lǐng)域。??