基于GPU的異構(gòu)大型矩陣求解方法

基本信息

申請?zhí)?/td> CN202110428174.8 申請日 -
公開(公告)號 CN113076520A 公開(公告)日 2021-07-06
申請公布號 CN113076520A 申請公布日 2021-07-06
分類號 G06F17/16(2006.01)I;G06F9/54(2006.01)I;G06F9/50(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 萬波;劉民慶 申請(專利權)人 湖北九同方微電子有限公司
代理機構(gòu) - 代理人 -
地址 430000湖北省武漢市湖北省武漢東湖新技術開發(fā)區(qū)高新大道999號未來城龍山創(chuàng)新園一期A4區(qū)3棟4層402號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及GPU矩陣求解技術領域,尤其涉及基于GPU的異構(gòu)大型矩陣求解方法,基于GPU的異構(gòu)大型矩陣求解方法,包括:將矩陣進行簡單的分塊,每個線程塊負責計算乘積矩陣的一個子方陣(塊內(nèi)的每個線程負責計算子方矩陣的一個元素);首先使用每個線程加載分塊方陣對應元素,然后計算乘積方陣的一個元素;每一線程將乘積的結(jié)果,累計到寄存器中,執(zhí)行完畢后,將結(jié)構(gòu)寫入GPU內(nèi)存中。本發(fā)明充分利用GPU的多線程特點,從而大大提高其運算速度,并將內(nèi)側(cè)大小配置成16的倍數(shù),重復利用GPU的內(nèi)存讀取特點,符合GPU內(nèi)存讀取高效率的原則,可以在保證高速運算的前提下,使運算結(jié)果更加精確,避免繁雜的運算過程。