一種基于集成學(xué)習(xí)的線上內(nèi)容熱度預(yù)測方法
基本信息
申請?zhí)?/td> | CN201811295404.2 | 申請日 | - |
公開(公告)號 | CN109344319B | 公開(公告)日 | 2021-08-24 |
申請公布號 | CN109344319B | 申請公布日 | 2021-08-24 |
分類號 | G06F16/953;G06F16/33;G06N3/08 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 龍飛;許美霞;李玉壘 | 申請(專利權(quán))人 | 中國搜索信息科技股份有限公司 |
代理機(jī)構(gòu) | 北京市盛峰律師事務(wù)所 | 代理人 | 于國富 |
地址 | 100000北京市大興區(qū)北興路(東段)2號1幢一層120房間 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于集成學(xué)習(xí)的線上內(nèi)容熱度預(yù)測方法,涉及自然語言處理領(lǐng)域,包括預(yù)測預(yù)料的選擇與爬?。粚ε廊〉恼Z料進(jìn)行預(yù)處理;對預(yù)處理后的語料向量化,確定熱度閾值;模型訓(xùn)練與集成。該方法綜合考慮了線上內(nèi)容的話題、標(biāo)題和內(nèi)容質(zhì)量,使得預(yù)測模型具有可擴(kuò)展性;使用集成學(xué)習(xí)的方法預(yù)測線上內(nèi)容熱度,使得預(yù)測具有魯棒性,且更加準(zhǔn)確;性能相近的基礎(chǔ)學(xué)習(xí)器進(jìn)行集成,可得到較好的效果。 |
