機(jī)器數(shù)據(jù)類別自動發(fā)現(xiàn)和分類的方法及裝置
基本信息
申請?zhí)?/td> | CN201410674632.6 | 申請日 | - |
公開(公告)號 | CN104331507A | 公開(公告)日 | 2015-02-04 |
申請公布號 | CN104331507A | 申請公布日 | 2015-02-04 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 柳楊;唐玉芳;秦剛;江舟;孔祥鵬;張紅意 | 申請(專利權(quán))人 | 蘇州數(shù)匠科技有限公司 |
代理機(jī)構(gòu) | 北京三友知識產(chǎn)權(quán)代理有限公司 | 代理人 | 北京數(shù)迅科技有限公司;北京數(shù)介科技有限公司 |
地址 | 100088 北京市西城區(qū)新街口外大街28號普天德勝A座406號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種機(jī)器數(shù)據(jù)類別自動發(fā)現(xiàn)和分類的方法及裝置,其中方法包括:對機(jī)器數(shù)據(jù)的源代碼進(jìn)行分析,找出機(jī)器數(shù)據(jù)中的固定詞匯,構(gòu)建包含機(jī)器數(shù)據(jù)中固定詞匯的完備字典;利用所述完備字典對機(jī)器數(shù)據(jù)進(jìn)行分析,過濾掉機(jī)器數(shù)據(jù)中的可變詞匯;根據(jù)過濾掉可變詞匯后的機(jī)器數(shù)據(jù)中固定詞匯,對機(jī)器數(shù)據(jù)進(jìn)行類別自動發(fā)現(xiàn)和分類。采用本發(fā)明可以實(shí)現(xiàn)對機(jī)器數(shù)據(jù)進(jìn)行類別自動發(fā)現(xiàn)和分類,并獲取較高的分類準(zhǔn)確率,無需人工參與,無需事先利用大量的訓(xùn)練樣本學(xué)習(xí)分類器,還可以對機(jī)器數(shù)據(jù)流進(jìn)行實(shí)時分析,自動發(fā)現(xiàn)機(jī)器數(shù)據(jù)中出現(xiàn)的新類別。 |
