新聞內(nèi)容推送方法、裝置、存儲介質(zhì)及計算機(jī)設(shè)備

基本信息

申請?zhí)?/td> CN202011047397.1 申請日 -
公開(公告)號 CN111898034A 公開(公告)日 2020-11-06
申請公布號 CN111898034A 申請公布日 2020-11-06
分類號 G06F16/9535(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 甘宇;夏志超;王君;張雷;袁海光;李振剛;劉斯凡 申請(專利權(quán))人 江西漢辰信息技術(shù)股份有限公司
代理機(jī)構(gòu) 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 江西漢辰信息技術(shù)股份有限公司;深圳京發(fā)科技控股有限公司
地址 330000江西省南昌市南昌高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)高新大道589號南昌大學(xué)科技園一號大樓三樓A301、A302室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種新聞內(nèi)容推送方法、裝置、存儲介質(zhì)及計算機(jī)設(shè)備,該方法包括:獲取鏈接,解析得到文本內(nèi)容;對文本內(nèi)容進(jìn)行分詞;采用多種關(guān)鍵詞提取算法提取關(guān)鍵詞,得到每種方法對應(yīng)提取的關(guān)鍵詞,根據(jù)每種方法提取的關(guān)鍵詞累計查重,并確定重復(fù)數(shù)最多的目標(biāo)關(guān)鍵詞;將目標(biāo)關(guān)鍵詞與文本內(nèi)容匹配,篩選出只含有目標(biāo)關(guān)鍵詞的文本并作為文本特征;計算文本特征的相似性對預(yù)測模型進(jìn)行訓(xùn)練,利用訓(xùn)練后的預(yù)測模型與待查詢文本進(jìn)行預(yù)測,得到相似度值;對各個所述文本內(nèi)容的相似度值排序,獲取若干篇相似度值最高的所述文本內(nèi)容對應(yīng)的新聞。本發(fā)明提供的新聞內(nèi)容推送方法,通過采用多種關(guān)鍵詞提取算法和預(yù)測模型預(yù)測提升對于新聞信息獲取的精準(zhǔn)性。??