一種面向GPU資源的任務(wù)調(diào)度方法、裝置和系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201910289968.3 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN109992422A | 公開(公告)日 | 2019-07-09 |
申請(qǐng)公布號(hào) | CN109992422A | 申請(qǐng)公布日 | 2019-07-09 |
分類號(hào) | G06F9/50(2006.01)I; G06F9/48(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 許歡慶; 牟永奇; 李潔; 湯勁武 | 申請(qǐng)(專利權(quán))人 | 北京朗鏡科技有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 北京朗鏡科技有限責(zé)任公司 |
地址 | 100026 北京市朝陽區(qū)朝陽北路225號(hào)1號(hào)樓1-4內(nèi)5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)實(shí)施例公開了一種面向GPU資源的任務(wù)調(diào)度方法,當(dāng)需要利用服務(wù)器集群中的顯存資源執(zhí)行任務(wù)(例如第一目標(biāo)任務(wù))時(shí),根據(jù)第一任務(wù)請(qǐng)求中包括的第一目標(biāo)任務(wù)的屬性信息和任務(wù)資源使用配置表計(jì)算第一目標(biāo)任務(wù)所需的顯存資源大小,然后,根據(jù)服務(wù)器集群的可用資源狀態(tài)表,確定滿足第一目標(biāo)任務(wù)所需的顯存資源大小的GPU,以便任務(wù)執(zhí)行模塊利用目標(biāo)GPU執(zhí)行第一目標(biāo)任務(wù)。本方案接收到任務(wù)請(qǐng)求時(shí),會(huì)進(jìn)行任務(wù)的顯存資源估算,以顯存資源為最小單位選取可用的GPU來完成任務(wù),細(xì)化資源管理和任務(wù)調(diào)度的粒度。若一個(gè)GPU中顯存資源符合任務(wù)要求,便可能實(shí)現(xiàn)一個(gè)GPU并行執(zhí)行多個(gè)任務(wù)的目的,提高了GPU中顯存資源的利用率。 |
