頻繁模式挖掘方法及裝置
基本信息
申請?zhí)?/td> | CN201810594153.1 | 申請日 | - |
公開(公告)號 | CN108846083A | 公開(公告)日 | 2018-11-20 |
申請公布號 | CN108846083A | 申請公布日 | 2018-11-20 |
分類號 | G06F17/30 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李德彥;晉耀紅;席麗娜 | 申請(專利權(quán))人 | 北京神州泰岳軟件股份有限公司 |
代理機構(gòu) | 北京弘權(quán)知識產(chǎn)權(quán)代理事務所(普通合伙) | 代理人 | 北京神州泰岳軟件股份有限公司 |
地址 | 100089 北京市海淀區(qū)萬泉莊路28號萬柳新貴大廈A座601室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例提供了一種頻繁模式挖掘方法及裝置,本發(fā)明實施例首先將各個分詞轉(zhuǎn)換為對應的編碼,之后利用編碼進行篩選,得到目標頻繁項集編碼組合,其中目標頻繁項集編碼組合包括頻繁項集中各個詞匯對應的編碼,利用編碼組成的目標頻繁項集編碼組合構(gòu)造FP?Tree或進行頻繁模式挖掘,而不是直接利用詞匯構(gòu)造FP?Tree或進行頻繁項集挖掘,可以有效降低頻繁模式挖掘過程中的空間消耗。同時,本發(fā)明實施例的技術(shù)方案中利用預定長度范圍篩選頻繁項集對應的編碼,能夠針對不同應用場景進行有意義頻繁模式長度的頻繁模式挖掘,從而有效降低了頻繁模式挖掘的時間消耗和資源消耗,增強了本發(fā)明的技術(shù)方案的工程化應用能力。 |
