機器數(shù)據(jù)類別自動發(fā)現(xiàn)和分類的方法及裝置
基本信息
申請?zhí)?/td> | CN201410674632.6 | 申請日 | - |
公開(公告)號 | CN104331507B | 公開(公告)日 | 2018-04-27 |
申請公布號 | CN104331507B | 申請公布日 | 2018-04-27 |
分類號 | G06F17/30 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 柳楊;唐玉芳;秦剛;江舟;孔祥鵬;張紅意 | 申請(專利權(quán))人 | 蘇州數(shù)匠科技有限公司 |
代理機構(gòu) | 北京三友知識產(chǎn)權(quán)代理有限公司 | 代理人 | 北京數(shù)介科技有限公司 |
地址 | 101111 北京市西城區(qū)新街口外大街28號A座408號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種機器數(shù)據(jù)類別自動發(fā)現(xiàn)和分類的方法及裝置,其中方法包括:對機器數(shù)據(jù)的源代碼進行分析,找出機器數(shù)據(jù)中的固定詞匯,構(gòu)建包含機器數(shù)據(jù)中固定詞匯的完備字典;利用所述完備字典對機器數(shù)據(jù)進行分析,過濾掉機器數(shù)據(jù)中的可變詞匯;根據(jù)過濾掉可變詞匯后的機器數(shù)據(jù)中固定詞匯,對機器數(shù)據(jù)進行類別自動發(fā)現(xiàn)和分類。采用本發(fā)明可以實現(xiàn)對機器數(shù)據(jù)進行類別自動發(fā)現(xiàn)和分類,并獲取較高的分類準(zhǔn)確率,無需人工參與,無需事先利用大量的訓(xùn)練樣本學(xué)習(xí)分類器,還可以對機器數(shù)據(jù)流進行實時分析,自動發(fā)現(xiàn)機器數(shù)據(jù)中出現(xiàn)的新類別。 |
