基于概率的無監(jiān)督缺陷預(yù)測方法

基本信息

申請?zhí)?/td> CN201610395767.8 申請日 -
公開(公告)號 CN106021115A 公開(公告)日 2016-10-12
申請公布號 CN106021115A 申請公布日 2016-10-12
分類號 G06F11/36(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 徐玲;陸正發(fā);鄢萌;楊夢寧;葛永新;洪明堅(jiān);張小洪;周末;楊丹 申請(專利權(quán))人 重慶優(yōu)霓空科技有限公司
代理機(jī)構(gòu) 重慶信航知識產(chǎn)權(quán)代理有限公司 代理人 重慶大學(xué);重慶優(yōu)霓空科技有限公司
地址 400044 重慶市沙坪壩區(qū)正街174號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及基于概率的無監(jiān)督缺陷預(yù)測方法,包括如下步驟,S1獲取度量元閾值,使用每個度量下源代碼類的度量元值的中位數(shù)作為閾值;S2度量元值與閾值的差值概率化;S3聚類,計算所有度量元下每個文件的概率之和,具有相同值的類歸為一類;S4標(biāo)記,如果某類文件所對應(yīng)的概率合大于等于L,則將該類文件標(biāo)記為有缺陷,否則標(biāo)記為無缺陷,從而將所有類標(biāo)記為有缺陷和沒有缺陷的兩類。本發(fā)明方法使用概率表示類存在缺陷的可能性,不同度量元值得到的概率不同,保留類存在缺陷可能性大小的信息。在標(biāo)記的過程中,根據(jù)數(shù)據(jù)集中缺陷的分布特點(diǎn),選取合適的臨界值進(jìn)行標(biāo)記。在避免信息丟失的同時,選擇合適的標(biāo)記臨界值,提高了缺陷預(yù)測的性能。