一種用于基于地域和行業(yè)進(jìn)行熱點(diǎn)事件挖掘的方法和設(shè)備
基本信息
申請?zhí)?/td> | CN201310693571.3 | 申請日 | - |
公開(公告)號 | CN103714132B | 公開(公告)日 | 2017-12-26 |
申請公布號 | CN103714132B | 申請公布日 | 2017-12-26 |
分類號 | G06F17/30(2006.01)I;G06F17/27(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉雪平 | 申請(專利權(quán))人 | 北京本果信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京英創(chuàng)嘉友知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 北京本果信息技術(shù)有限公司 |
地址 | 100083 北京市海淀區(qū)學(xué)清路38號金碼大廈B座20層頂一號房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種用于基于地域和行業(yè)進(jìn)行熱點(diǎn)事件挖掘的方法和設(shè)備。該方法包括:從網(wǎng)絡(luò)獲取文檔;對每篇文檔進(jìn)行分詞處理,并確定每篇文檔中各分詞的權(quán)重;根據(jù)所述權(quán)重確定每篇文檔的關(guān)鍵詞;對每篇文檔的內(nèi)容進(jìn)行地域和行業(yè)劃分;對內(nèi)容屬于同一地域同一行業(yè)的各篇文檔的關(guān)鍵詞進(jìn)行關(guān)聯(lián),形成關(guān)鍵詞組,并確定每個關(guān)鍵詞組的權(quán)重;以及按照所述關(guān)鍵詞組的權(quán)重確定該地域該行業(yè)下的熱點(diǎn)事件。由于是針對特定地域和特定行業(yè)進(jìn)行挖掘,因此可根據(jù)用戶請求,向用戶提供其所關(guān)心的地域行業(yè)下的熱點(diǎn)事件。并且,還可以減少挖掘時(shí)間,降低計(jì)算量,節(jié)省系統(tǒng)資源。 |
