文本分類模型構(gòu)建、文本分類方法及裝置

基本信息

申請?zhí)?/td> CN202110322136.4 申請日 -
公開(公告)號 CN112948586A 公開(公告)日 2021-06-11
申請公布號 CN112948586A 申請公布日 2021-06-11
分類號 G06F16/35;G06F40/242;G06F40/30;G06N20/00 分類 計算;推算;計數(shù);
發(fā)明人 謝先招;向修海 申請(專利權(quán))人 武漢優(yōu)品楚鼎科技有限公司
代理機構(gòu) 北京路浩知識產(chǎn)權(quán)代理有限公司 代理人 盛明星
地址 430000 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)光谷大道77號金融港后臺服務(wù)中心一期A1棟19層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種文本分類模型構(gòu)建、文本分類方法及裝置,所述文本分類模型構(gòu)建方法包括:構(gòu)建情感詞典;基于情感詞典對預(yù)先標(biāo)注文本數(shù)據(jù)進行數(shù)據(jù)清洗,得到中性文本數(shù)據(jù)集與非中性文本數(shù)據(jù)集;非中性文本數(shù)據(jù)集包括利好文本數(shù)據(jù)集及利空文本數(shù)據(jù)集,基于中性文本數(shù)據(jù)集與非中性文本數(shù)據(jù)集對第一文本分類模型進行訓(xùn)練,得到中性/非中性二分類器;基于利好文本數(shù)據(jù)集及利空文本數(shù)據(jù)集對第二文本分類模型進行訓(xùn)練,得到利好/利空二分類器。文本分類方法中,基于所得到的文本分類模型對待測文本數(shù)據(jù)進行分類,提高了分類準(zhǔn)確度,同時提升對于文本數(shù)據(jù)的分類效率。