一種基于端到端模型訓(xùn)練的智能地址識別方法及裝置
基本信息
申請?zhí)?/td> | CN202011241374.4 | 申請日 | - |
公開(公告)號 | CN112329470A | 公開(公告)日 | 2021-02-05 |
申請公布號 | CN112329470A | 申請公布日 | 2021-02-05 |
分類號 | G06F40/295(2020.01)I; | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 蔣永余;孔慶超;張佳旭;王宇琪;趙菲菲;吳曉飛;彭鑫;奉凡;羅引;王磊 | 申請(專利權(quán))人 | 深圳中科聞歌科技有限公司 |
代理機(jī)構(gòu) | 北京華夏泰和知識產(chǎn)權(quán)代理有限公司 | 代理人 | 杜欣;吳雪 |
地址 | 100028北京市海淀區(qū)北四環(huán)西路9號樓銀谷大廈7層0715室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┝艘环N基于端到端模型訓(xùn)練的智能地址識別方法及裝置,屬于計算機(jī)技術(shù)領(lǐng)域。本申請通過獲取訓(xùn)練數(shù)據(jù)集,所述訓(xùn)練數(shù)據(jù)集包括多個地址文本數(shù)據(jù)及每個所述地址文本數(shù)據(jù)對應(yīng)的驗證數(shù)據(jù);針對每個地址文本數(shù)據(jù),生成所述地址文本數(shù)據(jù)對應(yīng)的字符嵌入向量序列;將所述字符嵌入向量序列輸入至第一級子模型;將每一級子模型的輸出數(shù)據(jù)與所述驗證數(shù)據(jù)比較,得到多個誤差;根據(jù)所述多個誤差調(diào)整所述地址文本識別模型的參數(shù),直至所述地址文本識別模型收斂時,訓(xùn)練結(jié)束。通過本申請,可以將多個級聯(lián)的子模型產(chǎn)生的多個誤差,作為依據(jù)以調(diào)整地址文本識別模型的參數(shù),減少多個級聯(lián)子模型的整體誤差,避免了多個子模型之間的誤差累積。?? |
