一種軟件重復(fù)缺陷報(bào)告檢測(cè)的方法
基本信息
申請(qǐng)?zhí)?/td> | CN201410234198.X | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN103970666A | 公開(公告)日 | 2014-08-06 |
申請(qǐng)公布號(hào) | CN103970666A | 申請(qǐng)公布日 | 2014-08-06 |
分類號(hào) | G06F11/36(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 徐玲;鄒杰;葛永新;楊夢(mèng)寧;洪明堅(jiān);張小洪;蔣欣志 | 申請(qǐng)(專利權(quán))人 | 重慶優(yōu)霓空科技有限公司 |
代理機(jī)構(gòu) | 重慶博凱知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 重慶大學(xué);重慶優(yōu)霓空科技有限公司 |
地址 | 400044 重慶市沙坪壩區(qū)沙正街174號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種軟件重復(fù)缺陷報(bào)告檢測(cè)的方法,它包括如下步驟,首先從軟件的缺陷報(bào)告數(shù)據(jù)庫(kù)中提取訓(xùn)練樣本集和測(cè)試樣本集,建立訓(xùn)練樣本集的主題模型,然后對(duì)測(cè)試樣本應(yīng)用主題模型得到文檔-主題矩陣,計(jì)算測(cè)試樣本間的主題相似度,提取測(cè)試樣本的分類信息計(jì)算分類信息相似度,將分類信息相似度和主題相似度相乘得到測(cè)試樣本間的LDA相似度;其次提取測(cè)試樣本N-gram序列計(jì)算N-gram相似度,將N-gram相似度和LDA相似度加權(quán)求和得測(cè)試樣本間的整體相似度,最后如果整體相似度大于等于預(yù)設(shè)的閥值則認(rèn)為兩個(gè)測(cè)試樣本為重復(fù)缺陷報(bào)告。本方法極大地提高了檢測(cè)結(jié)果的準(zhǔn)確性,盡量避免將重復(fù)缺陷報(bào)告派給開發(fā)人員,節(jié)省了人力資源。 |
