頻繁模式挖掘方法及裝置
基本信息
申請?zhí)?/td> | CN201810594153.1 | 申請日 | - |
公開(公告)號 | CN108846083B | 公開(公告)日 | 2021-08-27 |
申請公布號 | CN108846083B | 申請公布日 | 2021-08-27 |
分類號 | G06F16/2458(2019.01)I | 分類 | 計算;推算;計數; |
發(fā)明人 | 李德彥;晉耀紅;席麗娜 | 申請(專利權)人 | 北京神州泰岳軟件股份有限公司 |
代理機構 | 北京弘權知識產權代理有限公司 | 代理人 | 逯長明;許偉群 |
地址 | 100080北京市海淀區(qū)海淀大街34號8層818室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例提供了一種頻繁模式挖掘方法及裝置,本發(fā)明實施例首先將各個分詞轉換為對應的編碼,之后利用編碼進行篩選,得到目標頻繁項集編碼組合,其中目標頻繁項集編碼組合包括頻繁項集中各個詞匯對應的編碼,利用編碼組成的目標頻繁項集編碼組合構造FP?Tree或進行頻繁模式挖掘,而不是直接利用詞匯構造FP?Tree或進行頻繁項集挖掘,可以有效降低頻繁模式挖掘過程中的空間消耗。同時,本發(fā)明實施例的技術方案中利用預定長度范圍篩選頻繁項集對應的編碼,能夠針對不同應用場景進行有意義頻繁模式長度的頻繁模式挖掘,從而有效降低了頻繁模式挖掘的時間消耗和資源消耗,增強了本發(fā)明的技術方案的工程化應用能力。 |
