一種卷積神經(jīng)網(wǎng)絡(luò)的新聞?dòng)脩襞d趣挖掘方法

基本信息

申請?zhí)?/td> CN201910435240.7 申請日 -
公開(公告)號(hào) CN110209815A 公開(公告)日 2019-09-06
申請公布號(hào) CN110209815A 申請公布日 2019-09-06
分類號(hào) G06F16/35(2019.01)I; G06F17/27(2006.01)I; G06N3/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉春陽; 王鵬; 張旭; 張翔宇; 陳志鵬; 李磊; 王利軍 申請(專利權(quán))人 北京天潤基業(yè)科技發(fā)展股份有限公司
代理機(jī)構(gòu) 北京慧泉知識(shí)產(chǎn)權(quán)代理有限公司 代理人 國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心; 北京天潤基業(yè)科技發(fā)展股份有限公司
地址 100029 北京市朝陽區(qū)裕民路甲3號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種卷積神經(jīng)網(wǎng)絡(luò)的新聞?dòng)脩襞d趣挖掘方法:步驟一:定義興趣標(biāo)簽;步驟二:訓(xùn)練數(shù)據(jù)構(gòu)造;步驟三、詞向量的語料收集與詞向量訓(xùn)練;步驟四、構(gòu)造word到token和token到word的映射,得到映射表;步驟五、在映射表基礎(chǔ)上,對原始文本進(jìn)行轉(zhuǎn)換;步驟六:加載預(yù)訓(xùn)練好的詞向量文件,構(gòu)造一個(gè)詞典詞匯數(shù)量vocab_size*詞向量維度embedding_size大小的矩陣;步驟七:將帶有興趣標(biāo)簽的微博文本數(shù)據(jù)接入到分類模型訓(xùn)練。本發(fā)明實(shí)現(xiàn)了一種自動(dòng)構(gòu)造新聞?dòng)脩襞d趣標(biāo)簽的方法,通過構(gòu)建一個(gè)結(jié)合連續(xù)的語義特征CNN卷積神經(jīng)網(wǎng)絡(luò)作為興趣文本分類器,對用戶的新聞評(píng)論進(jìn)行興趣分類,得到用戶的興趣。