一種用于基于地域和行業(yè)進(jìn)行熱點(diǎn)事件挖掘的方法和設(shè)備

基本信息

申請?zhí)?/td> CN201310693571.3 申請日 -
公開(公告)號 CN103714132B 公開(公告)日 2017-12-26
申請公布號 CN103714132B 申請公布日 2017-12-26
分類號 G06F17/30(2006.01)I;G06F17/27(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉雪平 申請(專利權(quán))人 北京本果信息技術(shù)有限公司
代理機(jī)構(gòu) 北京英創(chuàng)嘉友知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京本果信息技術(shù)有限公司
地址 100083 北京市海淀區(qū)學(xué)清路38號金碼大廈B座20層頂一號房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種用于基于地域和行業(yè)進(jìn)行熱點(diǎn)事件挖掘的方法和設(shè)備。該方法包括:從網(wǎng)絡(luò)獲取文檔;對每篇文檔進(jìn)行分詞處理,并確定每篇文檔中各分詞的權(quán)重;根據(jù)所述權(quán)重確定每篇文檔的關(guān)鍵詞;對每篇文檔的內(nèi)容進(jìn)行地域和行業(yè)劃分;對內(nèi)容屬于同一地域同一行業(yè)的各篇文檔的關(guān)鍵詞進(jìn)行關(guān)聯(lián),形成關(guān)鍵詞組,并確定每個關(guān)鍵詞組的權(quán)重;以及按照所述關(guān)鍵詞組的權(quán)重確定該地域該行業(yè)下的熱點(diǎn)事件。由于是針對特定地域和特定行業(yè)進(jìn)行挖掘,因此可根據(jù)用戶請求,向用戶提供其所關(guān)心的地域行業(yè)下的熱點(diǎn)事件。并且,還可以減少挖掘時(shí)間,降低計(jì)算量,節(jié)省系統(tǒng)資源。