基于GPU的異構(gòu)大型矩陣求解方法
基本信息
申請?zhí)?/td> | CN202110428174.8 | 申請日 | - |
公開(公告)號 | CN113076520A | 公開(公告)日 | 2021-07-06 |
申請公布號 | CN113076520A | 申請公布日 | 2021-07-06 |
分類號 | G06F17/16(2006.01)I;G06F9/54(2006.01)I;G06F9/50(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 萬波;劉民慶 | 申請(專利權)人 | 湖北九同方微電子有限公司 |
代理機構(gòu) | - | 代理人 | - |
地址 | 430000湖北省武漢市湖北省武漢東湖新技術開發(fā)區(qū)高新大道999號未來城龍山創(chuàng)新園一期A4區(qū)3棟4層402號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及GPU矩陣求解技術領域,尤其涉及基于GPU的異構(gòu)大型矩陣求解方法,基于GPU的異構(gòu)大型矩陣求解方法,包括:將矩陣進行簡單的分塊,每個線程塊負責計算乘積矩陣的一個子方陣(塊內(nèi)的每個線程負責計算子方矩陣的一個元素);首先使用每個線程加載分塊方陣對應元素,然后計算乘積方陣的一個元素;每一線程將乘積的結(jié)果,累計到寄存器中,執(zhí)行完畢后,將結(jié)構(gòu)寫入GPU內(nèi)存中。本發(fā)明充分利用GPU的多線程特點,從而大大提高其運算速度,并將內(nèi)側(cè)大小配置成16的倍數(shù),重復利用GPU的內(nèi)存讀取特點,符合GPU內(nèi)存讀取高效率的原則,可以在保證高速運算的前提下,使運算結(jié)果更加精確,避免繁雜的運算過程。 |
