基于新聞內(nèi)容和主題特征的個(gè)性化新聞推薦裝置和方法

基本信息

申請?zhí)?/td> CN201210320475.X 申請日 -
公開(公告)號 CN102831234A 公開(公告)日 2012-12-19
申請公布號 CN102831234A 申請公布日 2012-12-19
分類號 G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 盧美蓮;劉金亮;葉小衛(wèi);王明華;曹一鳴;李佳珊 申請(專利權(quán))人 北京格致璞科技有限公司
代理機(jī)構(gòu) 北京德琦知識(shí)產(chǎn)權(quán)代理有限公司 代理人 北京郵電大學(xué);北京格致璞科技有限公司
地址 100876 北京市海淀區(qū)西土城路10號
法律狀態(tài) -

摘要

摘要 一種基于新聞內(nèi)容和主題特征的個(gè)性化新聞推薦裝置和方法,推薦裝置設(shè)有:新聞抓取、預(yù)處理、主題模型訓(xùn)練、主題模型預(yù)測、用戶模型構(gòu)建、新聞推薦和推薦處理共七個(gè)模塊。推薦方法是:利用主題模型和相關(guān)的命名實(shí)體名詞序列構(gòu)建個(gè)性化用戶模型來表示用戶閱讀新聞的興趣偏好,并對該用戶的主題特征向量進(jìn)行權(quán)值計(jì)算與轉(zhuǎn)換以降低熱門主題及新聞內(nèi)容單一對用戶興趣的影響,有效解決了用戶興趣集中、且推薦結(jié)果多樣性不足的缺陷。在推薦輸出階段,對初始推薦新聞列表進(jìn)行處理,在現(xiàn)有的重復(fù)數(shù)據(jù)刪除和冗余過濾的基礎(chǔ)上,添加了基于本發(fā)明個(gè)性化用戶模型的主題分組過程,并對新聞文本按照時(shí)效權(quán)值重新排序,實(shí)現(xiàn)準(zhǔn)確、多樣、新穎的個(gè)性化新聞推薦。