一種數(shù)據(jù)篩選的方法

基本信息

申請?zhí)?/td> CN201410667074.0 申請日 -
公開(公告)號 CN104376089B 公開(公告)日 2018-03-27
申請公布號 CN104376089B 申請公布日 2018-03-27
分類號 G06F17/30 分類 計算;推算;計數(shù);
發(fā)明人 江潮;賀建華;張光凌 申請(專利權(quán))人 八方傳神數(shù)碼科技(武漢)有限公司
代理機構(gòu) 北京康盛知識產(chǎn)權(quán)代理有限公司 代理人 語聯(lián)網(wǎng)(武漢)信息技術(shù)有限公司
地址 430070 湖北省武漢市東湖開發(fā)區(qū)光谷軟件園一期以西、南湖南路以南、光谷軟件園六期2幢5層205號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種數(shù)據(jù)篩選的方法,包括:從第一數(shù)據(jù)項的第一內(nèi)容中篩選多個第一關(guān)鍵詞,所述第一數(shù)據(jù)項為多個數(shù)據(jù)項中的一個;將篩選的第一關(guān)鍵詞與所述多個數(shù)據(jù)項的第一內(nèi)容逐個進行首次匹配,根據(jù)匹配結(jié)果將所述多個數(shù)據(jù)項分成匹配程度高和低的兩部分;從第一數(shù)據(jù)項的第二內(nèi)容中篩選多個第二關(guān)鍵詞,將篩選的第二關(guān)鍵詞與所述匹配程度低的數(shù)據(jù)項的第二內(nèi)容逐個進行匹配,根據(jù)匹配結(jié)果將所述匹配程度低的數(shù)據(jù)項的多個數(shù)據(jù)項分成兩部分;其中,所述第一內(nèi)容的數(shù)據(jù)量小于第二內(nèi)容的數(shù)據(jù)量;將兩次匹配后,各次匹配度高的多個數(shù)據(jù)項的作為一個集合,并對集合內(nèi)的數(shù)據(jù)項聚類分析。本發(fā)明提高了定位關(guān)注度高的作為網(wǎng)絡(luò)事件的數(shù)據(jù)項的速度。