一種數(shù)據(jù)篩選的方法
基本信息
申請?zhí)?/td> | CN201410667074.0 | 申請日 | - |
公開(公告)號 | CN104376089B | 公開(公告)日 | 2018-03-27 |
申請公布號 | CN104376089B | 申請公布日 | 2018-03-27 |
分類號 | G06F17/30 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 江潮;賀建華;張光凌 | 申請(專利權(quán))人 | 八方傳神數(shù)碼科技(武漢)有限公司 |
代理機構(gòu) | 北京康盛知識產(chǎn)權(quán)代理有限公司 | 代理人 | 語聯(lián)網(wǎng)(武漢)信息技術(shù)有限公司 |
地址 | 430070 湖北省武漢市東湖開發(fā)區(qū)光谷軟件園一期以西、南湖南路以南、光谷軟件園六期2幢5層205號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種數(shù)據(jù)篩選的方法,包括:從第一數(shù)據(jù)項的第一內(nèi)容中篩選多個第一關(guān)鍵詞,所述第一數(shù)據(jù)項為多個數(shù)據(jù)項中的一個;將篩選的第一關(guān)鍵詞與所述多個數(shù)據(jù)項的第一內(nèi)容逐個進行首次匹配,根據(jù)匹配結(jié)果將所述多個數(shù)據(jù)項分成匹配程度高和低的兩部分;從第一數(shù)據(jù)項的第二內(nèi)容中篩選多個第二關(guān)鍵詞,將篩選的第二關(guān)鍵詞與所述匹配程度低的數(shù)據(jù)項的第二內(nèi)容逐個進行匹配,根據(jù)匹配結(jié)果將所述匹配程度低的數(shù)據(jù)項的多個數(shù)據(jù)項分成兩部分;其中,所述第一內(nèi)容的數(shù)據(jù)量小于第二內(nèi)容的數(shù)據(jù)量;將兩次匹配后,各次匹配度高的多個數(shù)據(jù)項的作為一個集合,并對集合內(nèi)的數(shù)據(jù)項聚類分析。本發(fā)明提高了定位關(guān)注度高的作為網(wǎng)絡(luò)事件的數(shù)據(jù)項的速度。 |
