一種基于深度學(xué)習(xí)的優(yōu)化代碼反編譯方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN202210271791.6 申請日 -
公開(公告)號 CN114691151A 公開(公告)日 2022-07-01
申請公布號 CN114691151A 申請公布日 2022-07-01
分類號 G06F8/53(2018.01)I;G06F8/73(2018.01)I;G06F8/74(2018.01)I;G06F16/33(2019.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 梁瑞剛;曹穎;陳愷 申請(專利權(quán))人 中國科學(xué)院信息工程研究所
代理機(jī)構(gòu) 北京君尚知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 100093北京市海淀區(qū)閔莊路甲89號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于深度學(xué)習(xí)的優(yōu)化代碼反編譯方法和系統(tǒng)。該方法的步驟包括:利用低級編程語言LPL和高級編程語言HPL獲取低級中間語言LIR和高級中間語言HIR,作為訓(xùn)練數(shù)據(jù)集;利用訓(xùn)練數(shù)據(jù)集訓(xùn)練深度學(xué)習(xí)模型,學(xué)習(xí)LIR和HIR之間的映射規(guī)則,利用訓(xùn)練完成的深度學(xué)習(xí)模型,將待進(jìn)行反編譯的LPL的LIR翻譯為HIR;對深度學(xué)習(xí)模型得到的HIR進(jìn)行數(shù)據(jù)流恢復(fù)和控制結(jié)構(gòu)恢復(fù),生成HPL代碼;利用相似性匹配算法尋找與生成的HPL代碼相似的有源碼代碼,將有源碼代碼中的語義信息遷移到生成的HPL代碼中。本發(fā)明可以自動將LPL轉(zhuǎn)換為HPL,針對優(yōu)化和不優(yōu)化的二進(jìn)制反編譯都具有較高的準(zhǔn)確性。