一種基于機器學習的政策文本分類方法

基本信息

申請?zhí)?/td> CN202011585410.9 申請日 -
公開(公告)號 CN112668329A 公開(公告)日 2021-04-16
申請公布號 CN112668329A 申請公布日 2021-04-16
分類號 G06F40/289;G06F40/242;G06K9/62;G06N3/04;G06N3/08;G06N20/00;G06Q50/26 分類 計算;推算;計數(shù);
發(fā)明人 龔增輝;胡建敏 申請(專利權)人 廣州博士信息技術研究院有限公司
代理機構 廣州博士科創(chuàng)知識產(chǎn)權代理有限公司 代理人 李永鋒
地址 510000 廣東省廣州市高新技術產(chǎn)業(yè)開發(fā)區(qū)科學城科珠路203號1201D
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于機器學習的政策文本分類方法,包括S1)、將數(shù)據(jù)分類標注,單文本標注;S2)、將各個類別的數(shù)據(jù)作為訓練的數(shù)據(jù)集,S3)、將政策的標題合并為文本,并將文本轉(zhuǎn)化為向量;S4)、選擇CNN算法作為基礎算法,將所有卷積核得到的特征拼接起來即為文本的定長向量表示,對于文本分類問題,將其連接至softmax即構建出完整的模型;S5)、定義輸出的數(shù)據(jù);S6)、將向量加入到元組;S7)、定義分類器;S8)、定義損失函數(shù)和準確函數(shù)S9)、定義優(yōu)化方法,S10)、網(wǎng)絡訓練;S11)、模型評估;S12)、模型預測。本發(fā)明具有高效、準確的、智能的政策分類的效果,實現(xiàn)了大規(guī)模處理政策數(shù)據(jù)的分類的難題。