一種GPU資源調(diào)度方法

基本信息

申請?zhí)?/td> CN202010576793.7 申請日 -
公開(公告)號(hào) CN111796932A 公開(公告)日 2020-10-20
申請公布號(hào) CN111796932A 申請公布日 2020-10-20
分類號(hào) G06F9/50(2006.01)I;G06F9/48(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 徐山川;王濱;王臣漢 申請(專利權(quán))人 貝式計(jì)算(天津)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京卓唐知識(shí)產(chǎn)權(quán)代理有限公司 代理人 卜榮麗
地址 100027北京市朝陽區(qū)東三環(huán)北路天元港中心B1206
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及通信應(yīng)用技術(shù)領(lǐng)域,公開了一種GPU資源調(diào)度方法,包括步驟:S1、首先從集群中收集GPU的基本信息,并提供gpu?usages接口,進(jìn)入步驟S2;S2、創(chuàng)建GPU應(yīng)用,并向Kubernetes調(diào)度器發(fā)送應(yīng)用請求,進(jìn)入步驟S3;S3、Kubernetes調(diào)度器在接收到該應(yīng)用請求后會(huì)遍歷集群中所有的GPU應(yīng)用,進(jìn)入步驟S4;S4、通過gpu?usages接口計(jì)算滿足該應(yīng)用的調(diào)度需求的GPU,進(jìn)入步驟S5;S5、GPU管理器按照應(yīng)用上GPU所在機(jī)器將指定的GPU資源綁定到該應(yīng)用中。實(shí)現(xiàn)了單個(gè)GPU在多個(gè)應(yīng)用中按照GPU顯存和GPU算力百分比的共享,大大提升了單個(gè)GPU的利用效率,降低了GPU應(yīng)用的成本。??