一種軟件重復(fù)缺陷報(bào)告檢測(cè)的方法

基本信息

申請(qǐng)?zhí)?/td> CN201410234198.X 申請(qǐng)日 -
公開(公告)號(hào) CN103970666A 公開(公告)日 2014-08-06
申請(qǐng)公布號(hào) CN103970666A 申請(qǐng)公布日 2014-08-06
分類號(hào) G06F11/36(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 徐玲;鄒杰;葛永新;楊夢(mèng)寧;洪明堅(jiān);張小洪;蔣欣志 申請(qǐng)(專利權(quán))人 重慶優(yōu)霓空科技有限公司
代理機(jī)構(gòu) 重慶博凱知識(shí)產(chǎn)權(quán)代理有限公司 代理人 重慶大學(xué);重慶優(yōu)霓空科技有限公司
地址 400044 重慶市沙坪壩區(qū)沙正街174號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種軟件重復(fù)缺陷報(bào)告檢測(cè)的方法,它包括如下步驟,首先從軟件的缺陷報(bào)告數(shù)據(jù)庫(kù)中提取訓(xùn)練樣本集和測(cè)試樣本集,建立訓(xùn)練樣本集的主題模型,然后對(duì)測(cè)試樣本應(yīng)用主題模型得到文檔-主題矩陣,計(jì)算測(cè)試樣本間的主題相似度,提取測(cè)試樣本的分類信息計(jì)算分類信息相似度,將分類信息相似度和主題相似度相乘得到測(cè)試樣本間的LDA相似度;其次提取測(cè)試樣本N-gram序列計(jì)算N-gram相似度,將N-gram相似度和LDA相似度加權(quán)求和得測(cè)試樣本間的整體相似度,最后如果整體相似度大于等于預(yù)設(shè)的閥值則認(rèn)為兩個(gè)測(cè)試樣本為重復(fù)缺陷報(bào)告。本方法極大地提高了檢測(cè)結(jié)果的準(zhǔn)確性,盡量避免將重復(fù)缺陷報(bào)告派給開發(fā)人員,節(jié)省了人力資源。