GPU虛擬化算力的彈性調(diào)度方法、系統(tǒng)、設(shè)備和存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202011566583.6 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112286644A | 公開(kāi)(公告)日 | 2021-01-29 |
申請(qǐng)公布號(hào) | CN112286644A | 申請(qǐng)公布日 | 2021-01-29 |
分類號(hào) | G06F9/455;G06F9/445;G06F9/50;G06N5/04 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 謝建超 | 申請(qǐng)(專利權(quán))人 | 杭州博盾習(xí)言科技有限公司 |
代理機(jī)構(gòu) | 杭州創(chuàng)智卓英知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 張超 |
地址 | 311121 浙江省杭州市余杭區(qū)五常街道文一西路998號(hào)18幢210室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)涉及GPU虛擬化算力的彈性調(diào)度方法、系統(tǒng)、設(shè)備和存儲(chǔ)介質(zhì),屬于GPU虛擬化技術(shù)領(lǐng)域,該方法包括:對(duì)AI推理容器進(jìn)行自動(dòng)壓測(cè),得到歷史最大運(yùn)行指標(biāo);根據(jù)歷史最大運(yùn)行指標(biāo),自動(dòng)確定容器的算力配額;檢測(cè)容器在業(yè)務(wù)場(chǎng)景下的實(shí)時(shí)運(yùn)行指標(biāo);根據(jù)實(shí)時(shí)運(yùn)行指標(biāo)和預(yù)設(shè)的算力彈性調(diào)度條件,自動(dòng)調(diào)整容器實(shí)例數(shù)。實(shí)現(xiàn)了自動(dòng)化確定AI推理容器所分配的算力配額,提高了AI推理容器的部署效率,而且極大的提高了GPU算力的利用率。 |
