基于GPU的線程排布方法、裝置、設(shè)備以及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110835793.9 申請日 -
公開(公告)號 CN113641470A 公開(公告)日 2021-11-12
申請公布號 CN113641470A 申請公布日 2021-11-12
分類號 G06F9/48(2006.01)I;G06F9/50(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 趙源;黎雷生;朱鵬飛 申請(專利權(quán))人 曙光云計算集團有限公司
代理機構(gòu) 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 黃玉霞
地址 100193北京市海淀區(qū)東北旺西路8號院36號樓5層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于GPU的線程排布方法、裝置、設(shè)備以及存儲介質(zhì),所述方法包括:獲取所需要的線程;將所述線程分配到一維網(wǎng)格中;通過核函數(shù)將待計算的數(shù)組映射到所述線程上。本發(fā)明的技術(shù)方案,通過優(yōu)化線程的排布,將線程映射到一維網(wǎng)格中,使得線程可以按需分配,提高線程的利用率,可以使得很多計算不是非常復(fù)雜的核函數(shù)的性能得到一定程度的提升,且不需要修改核函數(shù)中的計算代碼,只需要修改元素的映射代碼,既可以降低操作難度也可以減少工作量;同時,本發(fā)明提供的映射方法,不僅可以計算三維數(shù)組,還可以很輕松的實現(xiàn)維數(shù)大于3的數(shù)組元素的并行計算,應(yīng)用范圍廣泛。