標(biāo)簽識別模型的訓(xùn)練、文本標(biāo)簽識別的方法及裝置
基本信息
申請?zhí)?/td> | CN202111086685.2 | 申請日 | - |
公開(公告)號 | CN113934867A | 公開(公告)日 | 2022-01-14 |
申請公布號 | CN113934867A | 申請公布日 | 2022-01-14 |
分類號 | G06F16/383(2019.01)I;G06K9/62(2022.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳瑩瑩;黃于晏 | 申請(專利權(quán))人 | 有米科技股份有限公司 |
代理機(jī)構(gòu) | 廣州三環(huán)專利商標(biāo)代理有限公司 | 代理人 | 肖宇揚(yáng);江銀會 |
地址 | 510006廣東省廣州市番禺區(qū)小谷圍街青藍(lán)街26號1701 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種標(biāo)簽識別模型的訓(xùn)練、文本標(biāo)簽識別的方法及裝置,該方法通過特征提取模型提取的樣本文本的文本特征對基礎(chǔ)標(biāo)簽識別模型執(zhí)行訓(xùn)練操作,能夠訓(xùn)練出精準(zhǔn)的標(biāo)簽識別模型,從而有利于使用該精準(zhǔn)的標(biāo)簽識別模型識別文本的標(biāo)簽,提高文本的標(biāo)簽的識別準(zhǔn)確性及效率;以及通過先基于輕量級特征提取模型(如ALBERT模型)提取樣本文本的文本特征,彌補(bǔ)了單純使用基礎(chǔ)標(biāo)簽識別模型開始對樣本文本處理時(shí)無法捕捉到樣本文本的上下文語義信息的缺點(diǎn)及有利于訓(xùn)練到模型較小的標(biāo)簽識別模型,從而使標(biāo)簽識別模型更易應(yīng)用到實(shí)際中去,提高了標(biāo)簽識別模型的適用性,如:適用于多字符(如詞語)的長文本。 |
