一種面向GPU資源的任務(wù)調(diào)度方法、裝置和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201910289968.3 申請(qǐng)日 -
公開(公告)號(hào) CN109992422A 公開(公告)日 2019-07-09
申請(qǐng)公布號(hào) CN109992422A 申請(qǐng)公布日 2019-07-09
分類號(hào) G06F9/50(2006.01)I; G06F9/48(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 許歡慶; 牟永奇; 李潔; 湯勁武 申請(qǐng)(專利權(quán))人 北京朗鏡科技有限責(zé)任公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 北京朗鏡科技有限責(zé)任公司
地址 100026 北京市朝陽區(qū)朝陽北路225號(hào)1號(hào)樓1-4內(nèi)5層
法律狀態(tài) -

摘要

摘要 本申請(qǐng)實(shí)施例公開了一種面向GPU資源的任務(wù)調(diào)度方法,當(dāng)需要利用服務(wù)器集群中的顯存資源執(zhí)行任務(wù)(例如第一目標(biāo)任務(wù))時(shí),根據(jù)第一任務(wù)請(qǐng)求中包括的第一目標(biāo)任務(wù)的屬性信息和任務(wù)資源使用配置表計(jì)算第一目標(biāo)任務(wù)所需的顯存資源大小,然后,根據(jù)服務(wù)器集群的可用資源狀態(tài)表,確定滿足第一目標(biāo)任務(wù)所需的顯存資源大小的GPU,以便任務(wù)執(zhí)行模塊利用目標(biāo)GPU執(zhí)行第一目標(biāo)任務(wù)。本方案接收到任務(wù)請(qǐng)求時(shí),會(huì)進(jìn)行任務(wù)的顯存資源估算,以顯存資源為最小單位選取可用的GPU來完成任務(wù),細(xì)化資源管理和任務(wù)調(diào)度的粒度。若一個(gè)GPU中顯存資源符合任務(wù)要求,便可能實(shí)現(xiàn)一個(gè)GPU并行執(zhí)行多個(gè)任務(wù)的目的,提高了GPU中顯存資源的利用率。