一種短文本分類方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202010062909.5 申請(qǐng)日 -
公開(公告)號(hào) CN111309901A 公開(公告)日 2020-06-19
申請(qǐng)公布號(hào) CN111309901A 申請(qǐng)公布日 2020-06-19
分類號(hào) G06F16/35(2019.01)I;G06F40/30(2020.01)I 分類 -
發(fā)明人 劉曉春;楊春宇;閆繼培;王競文 申請(qǐng)(專利權(quán))人 北京海鑫科金高科技股份有限公司
代理機(jī)構(gòu) 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 代理人 程琛
地址 100070北京市豐臺(tái)區(qū)南四環(huán)西路186號(hào)漢威國際廣場四區(qū)4號(hào)樓6層
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開了一種短文本分類方法及裝置,方法包括:對(duì)目標(biāo)短文本進(jìn)行向量化處理,得到向量化目標(biāo)短文本;提取所述向量化目標(biāo)短文本的特征,得到向量化目標(biāo)短文本特征;根據(jù)所述向量化目標(biāo)短文本特征,確定所述目標(biāo)短文本的語義向量;根據(jù)所述目標(biāo)短文本的語義向量,確定所述目標(biāo)短文本的類別。本發(fā)明實(shí)施例根據(jù)所述目標(biāo)短文本的語義向量,確定所述目標(biāo)短文本的類別,提高了分類精度,提高了分類準(zhǔn)確率;克服了支持向量機(jī)模型分類只能進(jìn)行二分類的問題,本發(fā)明支持多類分類;克服了支持向量機(jī)模型對(duì)大規(guī)模訓(xùn)練樣本難以實(shí)施的問題;自動(dòng)化對(duì)目標(biāo)短文本進(jìn)行分類,減少了工作人員工作量。??