一種基于集成學(xué)習(xí)的線上內(nèi)容熱度預(yù)測方法

基本信息

申請?zhí)?/td> CN201811295404.2 申請日 -
公開(公告)號 CN109344319B 公開(公告)日 2021-08-24
申請公布號 CN109344319B 申請公布日 2021-08-24
分類號 G06F16/953;G06F16/33;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 龍飛;許美霞;李玉壘 申請(專利權(quán))人 中國搜索信息科技股份有限公司
代理機(jī)構(gòu) 北京市盛峰律師事務(wù)所 代理人 于國富
地址 100000北京市大興區(qū)北興路(東段)2號1幢一層120房間
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于集成學(xué)習(xí)的線上內(nèi)容熱度預(yù)測方法,涉及自然語言處理領(lǐng)域,包括預(yù)測預(yù)料的選擇與爬?。粚ε廊〉恼Z料進(jìn)行預(yù)處理;對預(yù)處理后的語料向量化,確定熱度閾值;模型訓(xùn)練與集成。該方法綜合考慮了線上內(nèi)容的話題、標(biāo)題和內(nèi)容質(zhì)量,使得預(yù)測模型具有可擴(kuò)展性;使用集成學(xué)習(xí)的方法預(yù)測線上內(nèi)容熱度,使得預(yù)測具有魯棒性,且更加準(zhǔn)確;性能相近的基礎(chǔ)學(xué)習(xí)器進(jìn)行集成,可得到較好的效果。