一種利用新聞評論行為的網(wǎng)絡(luò)用戶人格自動識別方法
基本信息
申請?zhí)?/td> | CN201910435231.8 | 申請日 | - |
公開(公告)號 | CN110222262A | 公開(公告)日 | 2019-09-10 |
申請公布號 | CN110222262A | 申請公布日 | 2019-09-10 |
分類號 | G06F16/9535(2019.01)I; G06K9/00(2006.01)I; G06K9/62(2006.01)I; G06N20/00(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 劉春陽; 王鵬; 張旭; 張翔宇; 陳志鵬; 李磊; 王利軍 | 申請(專利權(quán))人 | 北京天潤基業(yè)科技發(fā)展股份有限公司 |
代理機構(gòu) | 北京慧泉知識產(chǎn)權(quán)代理有限公司 | 代理人 | 國家計算機網(wǎng)絡(luò)與信息安全管理中心; 北京天潤基業(yè)科技發(fā)展股份有限公司 |
地址 | 100029 北京市朝陽區(qū)裕民路甲3號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種利用新聞評論行為的網(wǎng)絡(luò)用戶人格自動識別方法:步驟一、利用新聞?wù)Z料資源,對每個新聞文本內(nèi)容進行中文分詞;篩選掉停用詞后得到該語料庫的所有不同的詞條,作為新聞內(nèi)容詞典;步驟二、利用機器學(xué)習(xí)方法,建立新聞評論行為到人格的預(yù)測模型;步驟三、在得到預(yù)測模型之后,針對新的網(wǎng)絡(luò)用戶,獲得該新的網(wǎng)絡(luò)用戶參與評論的所有新聞,采用獲得歸一化之后的自變量,利用訓(xùn)練得到的模型實現(xiàn)對網(wǎng)絡(luò)用戶人格的自動識別。本發(fā)明對人格的自動識別,無需用戶自我報告,時效性高;對用戶沒有任何干擾,生態(tài)效度高;可以做到大規(guī)模用戶人格的自動識別;人格識別效率提高;滿足在新聞網(wǎng)站場景下對人員人格特征的監(jiān)測要求。 |
