一種面向GPU的雙調(diào)歸并排序方法
基本信息
申請?zhí)?/td> | CN201210187386.2 | 申請日 | - |
公開(公告)號 | CN102750131A | 公開(公告)日 | 2012-10-24 |
申請公布號 | CN102750131A | 申請公布日 | 2012-10-24 |
分類號 | G06F9/38(2006.01)I;G06F9/50(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 遲學(xué)斌;王玨;闞圣哲;聶寧明;郎顯宇 | 申請(專利權(quán))人 | 北京北龍超級云計算有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京億騰知識產(chǎn)權(quán)代理事務(wù)所 | 代理人 | 中國科學(xué)院計算機(jī)網(wǎng)絡(luò)信息中心;北京北龍超級云計算有限責(zé)任公司 |
地址 | 100190 北京市海淀區(qū)中關(guān)村南四街四號軟件園2號樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種面向GPU的雙調(diào)排序方法和系統(tǒng),通過一個線程操作向量來模擬多個比較器,多個線程并行執(zhí)行歸并排序,其中對同一個工作組內(nèi)的線程同步使用同步函數(shù)來完成,對不同工作組內(nèi)的線程同步通過CPU完成,進(jìn)一步的可以使用多個向量來模擬更大長度向量,在排序過程中改變比較器操作數(shù)的寫回地址,對內(nèi)存讀寫進(jìn)行優(yōu)化。本發(fā)明在節(jié)省存儲空間的基礎(chǔ)上,有效地減少CPU和GPU之間的同步次數(shù)、減少執(zhí)行指令的總量和延時、增加GPU計算單元的利用率。 |
