一種基于端到端模型訓(xùn)練的智能地址識別方法及裝置

基本信息

申請?zhí)?/td> CN202011241374.4 申請日 -
公開(公告)號 CN112329470A 公開(公告)日 2021-02-05
申請公布號 CN112329470A 申請公布日 2021-02-05
分類號 G06F40/295(2020.01)I; 分類 計算;推算;計數(shù);
發(fā)明人 蔣永余;孔慶超;張佳旭;王宇琪;趙菲菲;吳曉飛;彭鑫;奉凡;羅引;王磊 申請(專利權(quán))人 深圳中科聞歌科技有限公司
代理機(jī)構(gòu) 北京華夏泰和知識產(chǎn)權(quán)代理有限公司 代理人 杜欣;吳雪
地址 100028北京市海淀區(qū)北四環(huán)西路9號樓銀谷大廈7層0715室
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┝艘环N基于端到端模型訓(xùn)練的智能地址識別方法及裝置,屬于計算機(jī)技術(shù)領(lǐng)域。本申請通過獲取訓(xùn)練數(shù)據(jù)集,所述訓(xùn)練數(shù)據(jù)集包括多個地址文本數(shù)據(jù)及每個所述地址文本數(shù)據(jù)對應(yīng)的驗證數(shù)據(jù);針對每個地址文本數(shù)據(jù),生成所述地址文本數(shù)據(jù)對應(yīng)的字符嵌入向量序列;將所述字符嵌入向量序列輸入至第一級子模型;將每一級子模型的輸出數(shù)據(jù)與所述驗證數(shù)據(jù)比較,得到多個誤差;根據(jù)所述多個誤差調(diào)整所述地址文本識別模型的參數(shù),直至所述地址文本識別模型收斂時,訓(xùn)練結(jié)束。通過本申請,可以將多個級聯(lián)的子模型產(chǎn)生的多個誤差,作為依據(jù)以調(diào)整地址文本識別模型的參數(shù),減少多個級聯(lián)子模型的整體誤差,避免了多個子模型之間的誤差累積。??