一種基于搜索行為的網(wǎng)絡(luò)熱點話題判定方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN201910707855.0 | 申請日 | - |
公開(公告)號 | CN112395480A | 公開(公告)日 | 2021-02-23 |
申請公布號 | CN112395480A | 申請公布日 | 2021-02-23 |
分類號 | G06F16/951(2019.01)I; | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 杜小軍;丁雨 | 申請(專利權(quán))人 | 北京中潤普達(dá)信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京律誠同業(yè)知識產(chǎn)權(quán)代理有限公司 | 代理人 | 祁建國;張燕華 |
地址 | 100029北京市西城區(qū)北三環(huán)中路甲29號院華尊大廈B座6層605 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于搜索行為自動發(fā)現(xiàn)和判定網(wǎng)絡(luò)熱點話題的方法,包括:采用文本的聚類方法、熱點發(fā)掘算法和分詞矩陣技術(shù)來實現(xiàn)熱點的發(fā)現(xiàn)。也就是當(dāng)一個類的規(guī)模很大的時候,運(yùn)用文本的聚類方法、熱點發(fā)掘算法和分詞矩陣技術(shù)就可以判定它是一個話題(Topic)。由于傳統(tǒng)的一些話題提取算法都是基于比較正式的文章或是比較專業(yè)的論文,而在這里我們需要針對網(wǎng)絡(luò)搜索行為的特點來實現(xiàn)熱點提取算法,這些搜索行為的特征體現(xiàn)為一些字詞或者關(guān)鍵詞匯。由于網(wǎng)絡(luò)上的話題存在相關(guān)性,因此將文本的聚類方法、關(guān)聯(lián)關(guān)系算法和分詞矩陣技術(shù)引入到話題提取算法中,從而實現(xiàn)網(wǎng)絡(luò)熱點話題的自動判斷和自主發(fā)現(xiàn)。?? |
