一種基于機器學習的政策文本分類方法
基本信息
申請?zhí)?/td> | CN202011585410.9 | 申請日 | - |
公開(公告)號 | CN112668329A | 公開(公告)日 | 2021-04-16 |
申請公布號 | CN112668329A | 申請公布日 | 2021-04-16 |
分類號 | G06F40/289;G06F40/242;G06K9/62;G06N3/04;G06N3/08;G06N20/00;G06Q50/26 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 龔增輝;胡建敏 | 申請(專利權)人 | 廣州博士信息技術研究院有限公司 |
代理機構 | 廣州博士科創(chuàng)知識產(chǎn)權代理有限公司 | 代理人 | 李永鋒 |
地址 | 510000 廣東省廣州市高新技術產(chǎn)業(yè)開發(fā)區(qū)科學城科珠路203號1201D | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于機器學習的政策文本分類方法,包括S1)、將數(shù)據(jù)分類標注,單文本標注;S2)、將各個類別的數(shù)據(jù)作為訓練的數(shù)據(jù)集,S3)、將政策的標題合并為文本,并將文本轉(zhuǎn)化為向量;S4)、選擇CNN算法作為基礎算法,將所有卷積核得到的特征拼接起來即為文本的定長向量表示,對于文本分類問題,將其連接至softmax即構建出完整的模型;S5)、定義輸出的數(shù)據(jù);S6)、將向量加入到元組;S7)、定義分類器;S8)、定義損失函數(shù)和準確函數(shù)S9)、定義優(yōu)化方法,S10)、網(wǎng)絡訓練;S11)、模型評估;S12)、模型預測。本發(fā)明具有高效、準確的、智能的政策分類的效果,實現(xiàn)了大規(guī)模處理政策數(shù)據(jù)的分類的難題。 |
