一種人工智能加速器的核函數(shù)編譯方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110812211.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113467783A | 公開(kāi)(公告)日 | 2021-10-01 |
申請(qǐng)公布號(hào) | CN113467783A | 申請(qǐng)公布日 | 2021-10-01 |
分類號(hào) | G06F8/41(2018.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 文進(jìn)輝;胡辰卜;景德 | 申請(qǐng)(專利權(quán))人 | 中科曙光國(guó)際信息產(chǎn)業(yè)有限公司 |
代理機(jī)構(gòu) | 北京品源專利代理有限公司 | 代理人 | 孔凡紅 |
地址 | 266101山東省青島市嶗山區(qū)松嶺路169號(hào)軟件園A區(qū)211房間 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例公開(kāi)了一種人工智能加速器的核函數(shù)編譯方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),該方法包括:獲取人工智能加速器的目標(biāo)源碼文件并解析,以獲取至少一個(gè)深度學(xué)習(xí)段落;根據(jù)人工智能加速器的硬件結(jié)構(gòu)參數(shù)、核函數(shù)性能參數(shù)以及深度學(xué)習(xí)段落的輸入?yún)?shù)結(jié)構(gòu),獲取至少一個(gè)配置參數(shù)組,并根據(jù)至少一個(gè)配置參數(shù)組和至少一個(gè)初始核函數(shù),獲取至少一個(gè)配置核函數(shù);編譯至少一個(gè)配置核函數(shù),并獲取至少一個(gè)配置核函數(shù)中運(yùn)算速度最快的最優(yōu)配置核函數(shù)。本發(fā)明實(shí)施例提供的技術(shù)方案,通過(guò)代碼掃描及后臺(tái)的代碼編譯運(yùn)行,完成深度學(xué)習(xí)操作的最優(yōu)配置核函數(shù)的獲取,極大地減少了AI加速器針對(duì)深度學(xué)習(xí)訓(xùn)練的編譯時(shí)長(zhǎng),提高了AI加速器的計(jì)算效率。 |
