GPU虛擬化算力的彈性調(diào)度方法、系統(tǒng)、設備和存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011566583.6 申請日 -
公開(公告)號 CN112286644B 公開(公告)日 2021-05-28
申請公布號 CN112286644B 申請公布日 2021-05-28
分類號 G06F9/50(2006.01)I;G06F9/445(2018.01)I;G06F9/455(2006.01)I;G06N5/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 謝建超 申請(專利權)人 杭州博盾習言科技有限公司
代理機構 杭州創(chuàng)智卓英知識產(chǎn)權代理事務所(普通合伙) 代理人 張超
地址 311121 浙江省杭州市余杭區(qū)五常街道文一西路998號18幢210室
法律狀態(tài) -

摘要

摘要 本申請涉及GPU虛擬化算力的彈性調(diào)度方法、系統(tǒng)、設備和存儲介質(zhì),屬于GPU虛擬化技術領域,該方法包括:對AI推理容器進行自動壓測,得到歷史最大運行指標;根據(jù)歷史最大運行指標,自動確定容器的算力配額;檢測容器在業(yè)務場景下的實時運行指標;根據(jù)實時運行指標和預設的算力彈性調(diào)度條件,自動調(diào)整容器實例數(shù)。實現(xiàn)了自動化確定AI推理容器所分配的算力配額,提高了AI推理容器的部署效率,而且極大的提高了GPU算力的利用率。??