一種軟件重復(fù)缺陷報告檢測的方法

基本信息

申請?zhí)?/td> CN201410234198.X 申請日 -
公開(公告)號 CN103970666B 公開(公告)日 2017-02-22
申請公布號 CN103970666B 申請公布日 2017-02-22
分類號 G06F11/36(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 徐玲;鄒杰;葛永新;楊夢寧;洪明堅;張小洪;蔣欣志 申請(專利權(quán))人 重慶優(yōu)霓空科技有限公司
代理機構(gòu) 重慶博凱知識產(chǎn)權(quán)代理有限公司 代理人 重慶大學(xué);重慶優(yōu)霓空科技有限公司
地址 400044 重慶市沙坪壩區(qū)沙正街174號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種軟件重復(fù)缺陷報告檢測的方法,它包括如下步驟,首先從軟件的缺陷報告數(shù)據(jù)庫中提取訓(xùn)練樣本集和測試樣本集,建立訓(xùn)練樣本集的主題模型,然后對測試樣本應(yīng)用主題模型得到文檔?主題矩陣,計算測試樣本間的主題相似度,提取測試樣本的分類信息計算分類信息相似度,將分類信息相似度和主題相似度相乘得到測試樣本間的LDA相似度;其次提取測試樣本N?gram序列計算N?gram相似度,將N?gram相似度和LDA相似度加權(quán)求和得測試樣本間的整體相似度,最后如果整體相似度大于等于預(yù)設(shè)的閥值則認為兩個測試樣本為重復(fù)缺陷報告。本方法極大地提高了檢測結(jié)果的準確性,盡量避免將重復(fù)缺陷報告派給開發(fā)人員,節(jié)省了人力資源。