基于加權(quán)遞歸自編碼器的快速代碼克隆檢測方法及裝置

基本信息

申請?zhí)?/td> CN202011329523.2 申請日 -
公開(公告)號 CN112433756B 公開(公告)日 2021-09-07
申請公布號 CN112433756B 申請公布日 2021-09-07
分類號 G06F8/75;G06F16/901;G06F40/284;G06F40/30;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 劉偉;王嬴超;李曉偉;曾杰;楊洋;李春靜;劉金松;呂方雷 申請(專利權(quán))人 北京京航計算通訊研究所
代理機構(gòu) 北京天達知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 胡時冶
地址 100074 北京市豐臺區(qū)云崗北里西區(qū)1號院
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于加權(quán)遞歸自編碼器的快速代碼克隆檢測方法及裝置,屬于代碼克隆技術(shù)領(lǐng)域,解決了現(xiàn)有的代碼克隆技術(shù)檢測精度較差且效率較低的問題。方法包括:獲取待檢測代碼數(shù)據(jù)集,對待檢測代碼數(shù)據(jù)集進行預(yù)處理,得到待檢測代碼數(shù)據(jù)集中每一代碼對應(yīng)的二叉樹;基于二叉樹和加權(quán)遞歸自編碼器獲得待檢測代碼數(shù)據(jù)集中每一代碼對應(yīng)的最終向量,并基于每一代碼對應(yīng)的最終向量得到最終向量集合;基于最終向量集合構(gòu)建導(dǎo)航展開圖,并根據(jù)導(dǎo)航展開圖對最終向量集合中的任意兩個最終向量進行檢測,得到代碼克隆對。實現(xiàn)了代碼克隆對的快速檢測,提高了檢測效率和精度。