一種基于機(jī)器學(xué)習(xí)的政策文本分類方法
基本信息
申請(qǐng)?zhí)?/td> | CN202011585410.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112668329A | 公開(公告)日 | 2021-04-16 |
申請(qǐng)公布號(hào) | CN112668329A | 申請(qǐng)公布日 | 2021-04-16 |
分類號(hào) | G06F40/289;G06F40/242;G06K9/62;G06N3/04;G06N3/08;G06N20/00;G06Q50/26 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 龔增輝;胡建敏 | 申請(qǐng)(專利權(quán))人 | 廣州博士信息技術(shù)研究院有限公司 |
代理機(jī)構(gòu) | 廣州博士科創(chuàng)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 李永鋒 |
地址 | 510000 廣東省廣州市高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)科學(xué)城科珠路203號(hào)1201D | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于機(jī)器學(xué)習(xí)的政策文本分類方法,包括S1)、將數(shù)據(jù)分類標(biāo)注,單文本標(biāo)注;S2)、將各個(gè)類別的數(shù)據(jù)作為訓(xùn)練的數(shù)據(jù)集,S3)、將政策的標(biāo)題合并為文本,并將文本轉(zhuǎn)化為向量;S4)、選擇CNN算法作為基礎(chǔ)算法,將所有卷積核得到的特征拼接起來(lái)即為文本的定長(zhǎng)向量表示,對(duì)于文本分類問(wèn)題,將其連接至softmax即構(gòu)建出完整的模型;S5)、定義輸出的數(shù)據(jù);S6)、將向量加入到元組;S7)、定義分類器;S8)、定義損失函數(shù)和準(zhǔn)確函數(shù)S9)、定義優(yōu)化方法,S10)、網(wǎng)絡(luò)訓(xùn)練;S11)、模型評(píng)估;S12)、模型預(yù)測(cè)。本發(fā)明具有高效、準(zhǔn)確的、智能的政策分類的效果,實(shí)現(xiàn)了大規(guī)模處理政策數(shù)據(jù)的分類的難題。 |
