一種基于搜索行為的網(wǎng)絡(luò)熱點話題判定方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201910707855.0 申請日 -
公開(公告)號 CN112395480A 公開(公告)日 2021-02-23
申請公布號 CN112395480A 申請公布日 2021-02-23
分類號 G06F16/951(2019.01)I; 分類 計算;推算;計數(shù);
發(fā)明人 杜小軍;丁雨 申請(專利權(quán))人 北京中潤普達(dá)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京律誠同業(yè)知識產(chǎn)權(quán)代理有限公司 代理人 祁建國;張燕華
地址 100029北京市西城區(qū)北三環(huán)中路甲29號院華尊大廈B座6層605
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于搜索行為自動發(fā)現(xiàn)和判定網(wǎng)絡(luò)熱點話題的方法,包括:采用文本的聚類方法、熱點發(fā)掘算法和分詞矩陣技術(shù)來實現(xiàn)熱點的發(fā)現(xiàn)。也就是當(dāng)一個類的規(guī)模很大的時候,運(yùn)用文本的聚類方法、熱點發(fā)掘算法和分詞矩陣技術(shù)就可以判定它是一個話題(Topic)。由于傳統(tǒng)的一些話題提取算法都是基于比較正式的文章或是比較專業(yè)的論文,而在這里我們需要針對網(wǎng)絡(luò)搜索行為的特點來實現(xiàn)熱點提取算法,這些搜索行為的特征體現(xiàn)為一些字詞或者關(guān)鍵詞匯。由于網(wǎng)絡(luò)上的話題存在相關(guān)性,因此將文本的聚類方法、關(guān)聯(lián)關(guān)系算法和分詞矩陣技術(shù)引入到話題提取算法中,從而實現(xiàn)網(wǎng)絡(luò)熱點話題的自動判斷和自主發(fā)現(xiàn)。??