一種地址字符串的分詞方法及裝置

基本信息

申請?zhí)?/td> CN202011522142.6 申請日 -
公開(公告)號 CN112256932B 公開(公告)日 2021-04-09
申請公布號 CN112256932B 申請公布日 2021-04-09
分類號 G06Q30/00(2012.01)I;G06F40/289(2020.01)I;G06F40/216(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 侯建;黃峰;費春勇 申請(專利權)人 中博信息技術研究院有限公司
代理機構(gòu) 常州佰業(yè)騰飛專利代理事務所(普通合伙) 代理人 張勵
地址 210000江蘇省南京市雨花臺區(qū)小行尤家凹08號
法律狀態(tài) -

摘要

摘要 本申請公開了一種地址字符串的分詞方法及裝置,根據(jù)基礎地址庫的數(shù)據(jù),使用隱馬爾可夫模型HMM對地址字符串進行狀態(tài)預測;使用平滑優(yōu)化算法提升狀態(tài)預測的準確率;將概率最大的狀態(tài)預測的結(jié)果轉(zhuǎn)換為具體的地址信息。本申請以HMM模型作為基礎,將長地址字符串視為一個觀測序列,通過學習基礎地址庫中的狀態(tài)轉(zhuǎn)移規(guī)律,得出一個適用于中文地址分詞標注的模型,并采用了平滑優(yōu)化算法提升預測的準確率,計算結(jié)果可以得出該地址的狀態(tài)序列,將概率最大的結(jié)果作為最終的地址分詞方案,降低了人力時間成本,提升了效率。該方法不僅適用于電信領域的智能客服系統(tǒng),還適用于其他具有地址分詞相似場景的垂直領域。??