一種用于基于地域和行業(yè)進(jìn)行熱點(diǎn)事件挖掘的方法和設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN201310693571.3 申請(qǐng)日 -
公開(公告)號(hào) CN103714132A 公開(公告)日 2014-04-09
申請(qǐng)公布號(hào) CN103714132A 申請(qǐng)公布日 2014-04-09
分類號(hào) G06F17/30(2006.01)I;G06F17/27(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉雪平 申請(qǐng)(專利權(quán))人 北京本果信息技術(shù)有限公司
代理機(jī)構(gòu) 北京英創(chuàng)嘉友知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京本果信息技術(shù)有限公司
地址 100083 北京市海淀區(qū)學(xué)清路38號(hào)金碼大廈B座20層頂一號(hào)房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種用于基于地域和行業(yè)進(jìn)行熱點(diǎn)事件挖掘的方法和設(shè)備。該方法包括:從網(wǎng)絡(luò)獲取文檔;對(duì)每篇文檔進(jìn)行分詞處理,并確定每篇文檔中各分詞的權(quán)重;根據(jù)所述權(quán)重確定每篇文檔的關(guān)鍵詞;對(duì)每篇文檔的內(nèi)容進(jìn)行地域和行業(yè)劃分;對(duì)內(nèi)容屬于同一地域同一行業(yè)的各篇文檔的關(guān)鍵詞進(jìn)行關(guān)聯(lián),形成關(guān)鍵詞組,并確定每個(gè)關(guān)鍵詞組的權(quán)重;以及按照所述關(guān)鍵詞組的權(quán)重確定該地域該行業(yè)下的熱點(diǎn)事件。由于是針對(duì)特定地域和特定行業(yè)進(jìn)行挖掘,因此可根據(jù)用戶請(qǐng)求,向用戶提供其所關(guān)心的地域行業(yè)下的熱點(diǎn)事件。并且,還可以減少挖掘時(shí)間,降低計(jì)算量,節(jié)省系統(tǒng)資源。