一種文本分類方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202210215738.4 申請(qǐng)日 -
公開(公告)號(hào) CN114741503A 公開(公告)日 2022-07-12
申請(qǐng)公布號(hào) CN114741503A 申請(qǐng)公布日 2022-07-12
分類號(hào) G06F16/35(2019.01)I;G06F40/30(2020.01)I;G06F40/284(2020.01)I;G06F40/242(2020.01)I;G06K9/62(2022.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 姜衛(wèi)衛(wèi);楊青 申請(qǐng)(專利權(quán))人 度小滿科技(北京)有限公司
代理機(jī)構(gòu) 北京知帆遠(yuǎn)景知識(shí)產(chǎn)權(quán)代理有限公司 代理人 -
地址 100085北京市海淀區(qū)西北旺路10號(hào)院西區(qū)4號(hào)樓6層606
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文本分類方法,該方法調(diào)用包括掩碼語(yǔ)言模型解碼器、所述語(yǔ)義表征器以及所述分類器的訓(xùn)練模型,對(duì)其中的語(yǔ)義表征器以及掩碼語(yǔ)言模型解碼器分類器進(jìn)行參數(shù)優(yōu)化訓(xùn)練,通過(guò)掩碼語(yǔ)言模型解碼器訓(xùn)練語(yǔ)義表征能力,可以為分類器部分提供更有效的語(yǔ)義表征向量,從而提升了模型的語(yǔ)義表征能力,這樣使得模型在實(shí)際應(yīng)用中的語(yǔ)義分類數(shù)據(jù)集上的收斂速度更快,保證了訓(xùn)練得到的語(yǔ)義表征器以及掩碼語(yǔ)言模型解碼器分類器在具有更強(qiáng)的分類能力的同時(shí),又保證了其泛化性,從而提升了對(duì)于待分類文本的分類效果。本發(fā)明還公開了一種文本分類裝置、設(shè)備及可讀存儲(chǔ)介質(zhì),具有相應(yīng)的技術(shù)效果。