頻繁模式挖掘方法及裝置

基本信息

申請?zhí)?/td> CN201810594153.1 申請日 -
公開(公告)號 CN108846083A 公開(公告)日 2018-11-20
申請公布號 CN108846083A 申請公布日 2018-11-20
分類號 G06F17/30 分類 計算;推算;計數(shù);
發(fā)明人 李德彥;晉耀紅;席麗娜 申請(專利權(quán))人 北京神州泰岳軟件股份有限公司
代理機構(gòu) 北京弘權(quán)知識產(chǎn)權(quán)代理事務所(普通合伙) 代理人 北京神州泰岳軟件股份有限公司
地址 100089 北京市海淀區(qū)萬泉莊路28號萬柳新貴大廈A座601室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供了一種頻繁模式挖掘方法及裝置,本發(fā)明實施例首先將各個分詞轉(zhuǎn)換為對應的編碼,之后利用編碼進行篩選,得到目標頻繁項集編碼組合,其中目標頻繁項集編碼組合包括頻繁項集中各個詞匯對應的編碼,利用編碼組成的目標頻繁項集編碼組合構(gòu)造FP?Tree或進行頻繁模式挖掘,而不是直接利用詞匯構(gòu)造FP?Tree或進行頻繁項集挖掘,可以有效降低頻繁模式挖掘過程中的空間消耗。同時,本發(fā)明實施例的技術(shù)方案中利用預定長度范圍篩選頻繁項集對應的編碼,能夠針對不同應用場景進行有意義頻繁模式長度的頻繁模式挖掘,從而有效降低了頻繁模式挖掘的時間消耗和資源消耗,增強了本發(fā)明的技術(shù)方案的工程化應用能力。