GPU虛擬化算力的彈性調(diào)度方法、系統(tǒng)、設備和存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011566583.6 | 申請日 | - |
公開(公告)號 | CN112286644B | 公開(公告)日 | 2021-05-28 |
申請公布號 | CN112286644B | 申請公布日 | 2021-05-28 |
分類號 | G06F9/50(2006.01)I;G06F9/445(2018.01)I;G06F9/455(2006.01)I;G06N5/04(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 謝建超 | 申請(專利權)人 | 杭州博盾習言科技有限公司 |
代理機構 | 杭州創(chuàng)智卓英知識產(chǎn)權代理事務所(普通合伙) | 代理人 | 張超 |
地址 | 311121 浙江省杭州市余杭區(qū)五常街道文一西路998號18幢210室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請涉及GPU虛擬化算力的彈性調(diào)度方法、系統(tǒng)、設備和存儲介質(zhì),屬于GPU虛擬化技術領域,該方法包括:對AI推理容器進行自動壓測,得到歷史最大運行指標;根據(jù)歷史最大運行指標,自動確定容器的算力配額;檢測容器在業(yè)務場景下的實時運行指標;根據(jù)實時運行指標和預設的算力彈性調(diào)度條件,自動調(diào)整容器實例數(shù)。實現(xiàn)了自動化確定AI推理容器所分配的算力配額,提高了AI推理容器的部署效率,而且極大的提高了GPU算力的利用率。?? |
