一種基于機(jī)器學(xué)習(xí)的政策文本分類方法

基本信息

申請(qǐng)?zhí)?/td> CN202011585410.9 申請(qǐng)日 -
公開(公告)號(hào) CN112668329A 公開(公告)日 2021-04-16
申請(qǐng)公布號(hào) CN112668329A 申請(qǐng)公布日 2021-04-16
分類號(hào) G06F40/289;G06F40/242;G06K9/62;G06N3/04;G06N3/08;G06N20/00;G06Q50/26 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 龔增輝;胡建敏 申請(qǐng)(專利權(quán))人 廣州博士信息技術(shù)研究院有限公司
代理機(jī)構(gòu) 廣州博士科創(chuàng)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李永鋒
地址 510000 廣東省廣州市高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)科學(xué)城科珠路203號(hào)1201D
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于機(jī)器學(xué)習(xí)的政策文本分類方法,包括S1)、將數(shù)據(jù)分類標(biāo)注,單文本標(biāo)注;S2)、將各個(gè)類別的數(shù)據(jù)作為訓(xùn)練的數(shù)據(jù)集,S3)、將政策的標(biāo)題合并為文本,并將文本轉(zhuǎn)化為向量;S4)、選擇CNN算法作為基礎(chǔ)算法,將所有卷積核得到的特征拼接起來(lái)即為文本的定長(zhǎng)向量表示,對(duì)于文本分類問(wèn)題,將其連接至softmax即構(gòu)建出完整的模型;S5)、定義輸出的數(shù)據(jù);S6)、將向量加入到元組;S7)、定義分類器;S8)、定義損失函數(shù)和準(zhǔn)確函數(shù)S9)、定義優(yōu)化方法,S10)、網(wǎng)絡(luò)訓(xùn)練;S11)、模型評(píng)估;S12)、模型預(yù)測(cè)。本發(fā)明具有高效、準(zhǔn)確的、智能的政策分類的效果,實(shí)現(xiàn)了大規(guī)模處理政策數(shù)據(jù)的分類的難題。