一種卷積神經(jīng)網(wǎng)絡(luò)的新聞用戶興趣挖掘方法

基本信息

申請?zhí)?/td> CN201910435240.7 申請日 -
公開(公告)號 CN110209815A 公開(公告)日 2019-09-06
申請公布號 CN110209815A 申請公布日 2019-09-06
分類號 G06F16/35(2019.01)I; G06F17/27(2006.01)I; G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉春陽; 王鵬; 張旭; 張翔宇; 陳志鵬; 李磊; 王利軍 申請(專利權(quán))人 北京天潤基業(yè)科技發(fā)展股份有限公司
代理機構(gòu) 北京慧泉知識產(chǎn)權(quán)代理有限公司 代理人 國家計算機網(wǎng)絡(luò)與信息安全管理中心; 北京天潤基業(yè)科技發(fā)展股份有限公司
地址 100029 北京市朝陽區(qū)裕民路甲3號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種卷積神經(jīng)網(wǎng)絡(luò)的新聞用戶興趣挖掘方法:步驟一:定義興趣標(biāo)簽;步驟二:訓(xùn)練數(shù)據(jù)構(gòu)造;步驟三、詞向量的語料收集與詞向量訓(xùn)練;步驟四、構(gòu)造word到token和token到word的映射,得到映射表;步驟五、在映射表基礎(chǔ)上,對原始文本進(jìn)行轉(zhuǎn)換;步驟六:加載預(yù)訓(xùn)練好的詞向量文件,構(gòu)造一個詞典詞匯數(shù)量vocab_size*詞向量維度embedding_size大小的矩陣;步驟七:將帶有興趣標(biāo)簽的微博文本數(shù)據(jù)接入到分類模型訓(xùn)練。本發(fā)明實現(xiàn)了一種自動構(gòu)造新聞用戶興趣標(biāo)簽的方法,通過構(gòu)建一個結(jié)合連續(xù)的語義特征CNN卷積神經(jīng)網(wǎng)絡(luò)作為興趣文本分類器,對用戶的新聞評論進(jìn)行興趣分類,得到用戶的興趣。