一種基于數(shù)據(jù)壓縮Apriori算法的關聯(lián)規(guī)則挖掘方法

基本信息

申請?zhí)?/td> CN201110430528.9 申請日 -
公開(公告)號 CN103176976B 公開(公告)日 2016-01-20
申請公布號 CN103176976B 申請公布日 2016-01-20
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 高海洋;沈強;張軒溢;唐朝偉;趙志軍;慈松;唐暉 申請(專利權)人 無錫中科智能信息處理研發(fā)中心有限公司
代理機構 北京法思騰知識產(chǎn)權代理有限公司 代理人 中國科學院聲學研究所;無錫中科智能信息處理研發(fā)中心有限公司
地址 100190 北京市海淀區(qū)北四環(huán)西路21號
法律狀態(tài) -

摘要

摘要 一種基于數(shù)據(jù)壓縮Apriori算法的關聯(lián)規(guī)則挖掘方法,包括步驟:判斷數(shù)據(jù)庫中的事物記錄條數(shù)N大于該數(shù)據(jù)庫中所有數(shù)據(jù)項的所有可能的組合數(shù)M時,生成數(shù)據(jù)庫項與該數(shù)據(jù)項數(shù)量的映射表DB_Map_Table;將該映射表DB_Map_Table中的所有健值對<key,value>按照key的大小升序排列;使用Apriori算法生成I(I>2)項候選集時,判斷將要合并的兩個頻繁集中不同的項所組成的二項集是否為2項頻繁集的子集,如果是,則將將要合并的兩個頻繁集的合集加入候選集。本發(fā)明的效果在于,減小了原有事務數(shù)據(jù)庫的大小,減少了數(shù)據(jù)庫的掃描次數(shù),減少了算法運行過程中候選集的生成,從而在保證算法正確的同時有效地提高了算法的速度和效率。