矩陣數(shù)據(jù)廣播架構(gòu)
基本信息
申請?zhí)?/td> | CN201911336627.3 | 申請日 | - |
公開(公告)號 | CN113094099A | 公開(公告)日 | 2021-07-09 |
申請公布號 | CN113094099A | 申請公布日 | 2021-07-09 |
分類號 | G06F9/38(2006.01)I;G06F15/80(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 彭莉;楊建;湯遲 | 申請(專利權(quán))人 | 超威半導(dǎo)體(上海)有限公司 |
代理機(jī)構(gòu) | 上海勝康律師事務(wù)所 | 代理人 | 樊英如;邱曉敏 |
地址 | 201203上海市浦東新區(qū)張江高科技園區(qū),張東路1387號科技領(lǐng)袖之都(東區(qū))第48幢 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,更具體涉及矩陣數(shù)據(jù)廣播架構(gòu)。公開了用于通過減少存儲器訪問的數(shù)量來有效并行執(zhí)行處理器中的多個工作單元的系統(tǒng)、裝置和方法。計(jì)算系統(tǒng)包括具有并行數(shù)據(jù)架構(gòu)的處理器核。處理器核用矩陣運(yùn)算執(zhí)行軟件應(yīng)用程序。處理器核支持將共享數(shù)據(jù)廣播到處理器核的多個計(jì)算單元。編譯器或其他代碼基于檢測到計(jì)算單元之間的共享數(shù)據(jù),將線程組分配給計(jì)算單元。處理器核生成單個訪問請求,而不是將多個讀取訪問發(fā)送到存儲器子系統(tǒng)以獲取共享數(shù)據(jù)。單個訪問請求包括標(biāo)識多個計(jì)算單元的信息,以在通過處理器核廣播時(shí)接收共享數(shù)據(jù)。 |
