基于新聞內(nèi)容和主題特征的個(gè)性化新聞推薦裝置和方法
基本信息
申請?zhí)?/td> | CN201210320475.X | 申請日 | - |
公開(公告)號 | CN102831234A | 公開(公告)日 | 2012-12-19 |
申請公布號 | CN102831234A | 申請公布日 | 2012-12-19 |
分類號 | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 盧美蓮;劉金亮;葉小衛(wèi);王明華;曹一鳴;李佳珊 | 申請(專利權(quán))人 | 北京格致璞科技有限公司 |
代理機(jī)構(gòu) | 北京德琦知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 北京郵電大學(xué);北京格致璞科技有限公司 |
地址 | 100876 北京市海淀區(qū)西土城路10號 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于新聞內(nèi)容和主題特征的個(gè)性化新聞推薦裝置和方法,推薦裝置設(shè)有:新聞抓取、預(yù)處理、主題模型訓(xùn)練、主題模型預(yù)測、用戶模型構(gòu)建、新聞推薦和推薦處理共七個(gè)模塊。推薦方法是:利用主題模型和相關(guān)的命名實(shí)體名詞序列構(gòu)建個(gè)性化用戶模型來表示用戶閱讀新聞的興趣偏好,并對該用戶的主題特征向量進(jìn)行權(quán)值計(jì)算與轉(zhuǎn)換以降低熱門主題及新聞內(nèi)容單一對用戶興趣的影響,有效解決了用戶興趣集中、且推薦結(jié)果多樣性不足的缺陷。在推薦輸出階段,對初始推薦新聞列表進(jìn)行處理,在現(xiàn)有的重復(fù)數(shù)據(jù)刪除和冗余過濾的基礎(chǔ)上,添加了基于本發(fā)明個(gè)性化用戶模型的主題分組過程,并對新聞文本按照時(shí)效權(quán)值重新排序,實(shí)現(xiàn)準(zhǔn)確、多樣、新穎的個(gè)性化新聞推薦。 |
