并行處理中矩陣數(shù)據(jù)廣播的方法

基本信息

申請?zhí)?/td> CN201911315653.8 申請日 -
公開(公告)號 CN113010173A 公開(公告)日 2021-06-22
申請公布號 CN113010173A 申請公布日 2021-06-22
分類號 G06F8/41(2018.01)I;G06F9/54(2006.01)I;G06F15/78(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 彭莉;楊建;湯遲 申請(專利權)人 超威半導體(上海)有限公司
代理機構(gòu) 上海勝康律師事務所 代理人 樊英如;邱曉敏
地址 201203上海市浦東新區(qū)張江高科技園區(qū),張東路1387號科技領袖之都(東區(qū))第48幢
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種計算系統(tǒng),具體涉及在計算系統(tǒng)中并行處理中矩陣數(shù)據(jù)廣播的方法。公開了用于通過減少存儲器訪問的數(shù)量來有效并行執(zhí)行處理器中的多個工作單元的系統(tǒng)、裝置和方法。計算系統(tǒng)包括具有并行數(shù)據(jù)架構(gòu)的處理器核。軟件應用程序和固件中的一個或多個實現(xiàn)矩陣運算,并支持將共享數(shù)據(jù)廣播到處理器核的多個計算單元。該應用程序通過將應用程序的計算內(nèi)核與數(shù)據(jù)項進行匹配,并將得到的工作單元分組為線程組來創(chuàng)建線程組。應用程序基于檢測到計算單元之間的共享數(shù)據(jù),將線程組分配給計算單元。生成單個訪問請求,而不是將多個讀取訪問發(fā)送到存儲器子系統(tǒng)以獲取共享數(shù)據(jù)。單個訪問請求包括標識多個計算單元的信息,以在廣播時接收共享數(shù)據(jù)。