一種GPU資源調(diào)度方法
基本信息
申請?zhí)?/td> | CN202010576793.7 | 申請日 | - |
公開(公告)號(hào) | CN111796932A | 公開(公告)日 | 2020-10-20 |
申請公布號(hào) | CN111796932A | 申請公布日 | 2020-10-20 |
分類號(hào) | G06F9/50(2006.01)I;G06F9/48(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 徐山川;王濱;王臣漢 | 申請(專利權(quán))人 | 貝式計(jì)算(天津)信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京卓唐知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 卜榮麗 |
地址 | 100027北京市朝陽區(qū)東三環(huán)北路天元港中心B1206 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及通信應(yīng)用技術(shù)領(lǐng)域,公開了一種GPU資源調(diào)度方法,包括步驟:S1、首先從集群中收集GPU的基本信息,并提供gpu?usages接口,進(jìn)入步驟S2;S2、創(chuàng)建GPU應(yīng)用,并向Kubernetes調(diào)度器發(fā)送應(yīng)用請求,進(jìn)入步驟S3;S3、Kubernetes調(diào)度器在接收到該應(yīng)用請求后會(huì)遍歷集群中所有的GPU應(yīng)用,進(jìn)入步驟S4;S4、通過gpu?usages接口計(jì)算滿足該應(yīng)用的調(diào)度需求的GPU,進(jìn)入步驟S5;S5、GPU管理器按照應(yīng)用上GPU所在機(jī)器將指定的GPU資源綁定到該應(yīng)用中。實(shí)現(xiàn)了單個(gè)GPU在多個(gè)應(yīng)用中按照GPU顯存和GPU算力百分比的共享,大大提升了單個(gè)GPU的利用效率,降低了GPU應(yīng)用的成本。?? |
