新聞內(nèi)容推送方法、裝置、存儲介質(zhì)及計算機(jī)設(shè)備
基本信息
申請?zhí)?/td> | CN202011047397.1 | 申請日 | - |
公開(公告)號 | CN111898034A | 公開(公告)日 | 2020-11-06 |
申請公布號 | CN111898034A | 申請公布日 | 2020-11-06 |
分類號 | G06F16/9535(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 甘宇;夏志超;王君;張雷;袁海光;李振剛;劉斯凡 | 申請(專利權(quán))人 | 江西漢辰信息技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 江西漢辰信息技術(shù)股份有限公司;深圳京發(fā)科技控股有限公司 |
地址 | 330000江西省南昌市南昌高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)高新大道589號南昌大學(xué)科技園一號大樓三樓A301、A302室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種新聞內(nèi)容推送方法、裝置、存儲介質(zhì)及計算機(jī)設(shè)備,該方法包括:獲取鏈接,解析得到文本內(nèi)容;對文本內(nèi)容進(jìn)行分詞;采用多種關(guān)鍵詞提取算法提取關(guān)鍵詞,得到每種方法對應(yīng)提取的關(guān)鍵詞,根據(jù)每種方法提取的關(guān)鍵詞累計查重,并確定重復(fù)數(shù)最多的目標(biāo)關(guān)鍵詞;將目標(biāo)關(guān)鍵詞與文本內(nèi)容匹配,篩選出只含有目標(biāo)關(guān)鍵詞的文本并作為文本特征;計算文本特征的相似性對預(yù)測模型進(jìn)行訓(xùn)練,利用訓(xùn)練后的預(yù)測模型與待查詢文本進(jìn)行預(yù)測,得到相似度值;對各個所述文本內(nèi)容的相似度值排序,獲取若干篇相似度值最高的所述文本內(nèi)容對應(yīng)的新聞。本發(fā)明提供的新聞內(nèi)容推送方法,通過采用多種關(guān)鍵詞提取算法和預(yù)測模型預(yù)測提升對于新聞信息獲取的精準(zhǔn)性。?? |
