標(biāo)簽識別模型的訓(xùn)練、文本標(biāo)簽識別的方法及裝置

基本信息

申請?zhí)?/td> CN202111086685.2 申請日 -
公開(公告)號 CN113934867A 公開(公告)日 2022-01-14
申請公布號 CN113934867A 申請公布日 2022-01-14
分類號 G06F16/383(2019.01)I;G06K9/62(2022.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳瑩瑩;黃于晏 申請(專利權(quán))人 有米科技股份有限公司
代理機(jī)構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 肖宇揚(yáng);江銀會
地址 510006廣東省廣州市番禺區(qū)小谷圍街青藍(lán)街26號1701
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種標(biāo)簽識別模型的訓(xùn)練、文本標(biāo)簽識別的方法及裝置,該方法通過特征提取模型提取的樣本文本的文本特征對基礎(chǔ)標(biāo)簽識別模型執(zhí)行訓(xùn)練操作,能夠訓(xùn)練出精準(zhǔn)的標(biāo)簽識別模型,從而有利于使用該精準(zhǔn)的標(biāo)簽識別模型識別文本的標(biāo)簽,提高文本的標(biāo)簽的識別準(zhǔn)確性及效率;以及通過先基于輕量級特征提取模型(如ALBERT模型)提取樣本文本的文本特征,彌補(bǔ)了單純使用基礎(chǔ)標(biāo)簽識別模型開始對樣本文本處理時(shí)無法捕捉到樣本文本的上下文語義信息的缺點(diǎn)及有利于訓(xùn)練到模型較小的標(biāo)簽識別模型,從而使標(biāo)簽識別模型更易應(yīng)用到實(shí)際中去,提高了標(biāo)簽識別模型的適用性,如:適用于多字符(如詞語)的長文本。