一種基于數(shù)據(jù)壓縮Apriori算法的關聯(lián)規(guī)則挖掘方法
基本信息
申請?zhí)?/td> | CN201110430528.9 | 申請日 | - |
公開(公告)號 | CN103176976B | 公開(公告)日 | 2016-01-20 |
申請公布號 | CN103176976B | 申請公布日 | 2016-01-20 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 高海洋;沈強;張軒溢;唐朝偉;趙志軍;慈松;唐暉 | 申請(專利權)人 | 無錫中科智能信息處理研發(fā)中心有限公司 |
代理機構 | 北京法思騰知識產(chǎn)權代理有限公司 | 代理人 | 中國科學院聲學研究所;無錫中科智能信息處理研發(fā)中心有限公司 |
地址 | 100190 北京市海淀區(qū)北四環(huán)西路21號 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于數(shù)據(jù)壓縮Apriori算法的關聯(lián)規(guī)則挖掘方法,包括步驟:判斷數(shù)據(jù)庫中的事物記錄條數(shù)N大于該數(shù)據(jù)庫中所有數(shù)據(jù)項的所有可能的組合數(shù)M時,生成數(shù)據(jù)庫項與該數(shù)據(jù)項數(shù)量的映射表DB_Map_Table;將該映射表DB_Map_Table中的所有健值對<key,value>按照key的大小升序排列;使用Apriori算法生成I(I>2)項候選集時,判斷將要合并的兩個頻繁集中不同的項所組成的二項集是否為2項頻繁集的子集,如果是,則將將要合并的兩個頻繁集的合集加入候選集。本發(fā)明的效果在于,減小了原有事務數(shù)據(jù)庫的大小,減少了數(shù)據(jù)庫的掃描次數(shù),減少了算法運行過程中候選集的生成,從而在保證算法正確的同時有效地提高了算法的速度和效率。 |
