頻繁模式挖掘方法及裝置

基本信息

申請?zhí)?/td> CN201810594153.1 申請日 -
公開(公告)號 CN108846083B 公開(公告)日 2021-08-27
申請公布號 CN108846083B 申請公布日 2021-08-27
分類號 G06F16/2458(2019.01)I 分類 計算;推算;計數;
發(fā)明人 李德彥;晉耀紅;席麗娜 申請(專利權)人 北京神州泰岳軟件股份有限公司
代理機構 北京弘權知識產權代理有限公司 代理人 逯長明;許偉群
地址 100080北京市海淀區(qū)海淀大街34號8層818室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供了一種頻繁模式挖掘方法及裝置,本發(fā)明實施例首先將各個分詞轉換為對應的編碼,之后利用編碼進行篩選,得到目標頻繁項集編碼組合,其中目標頻繁項集編碼組合包括頻繁項集中各個詞匯對應的編碼,利用編碼組成的目標頻繁項集編碼組合構造FP?Tree或進行頻繁模式挖掘,而不是直接利用詞匯構造FP?Tree或進行頻繁項集挖掘,可以有效降低頻繁模式挖掘過程中的空間消耗。同時,本發(fā)明實施例的技術方案中利用預定長度范圍篩選頻繁項集對應的編碼,能夠針對不同應用場景進行有意義頻繁模式長度的頻繁模式挖掘,從而有效降低了頻繁模式挖掘的時間消耗和資源消耗,增強了本發(fā)明的技術方案的工程化應用能力。