基于確定性算子共存的服務調(diào)度方法及其應用的GPU

基本信息

申請?zhí)?/td> CN202111199598.8 申請日 -
公開(公告)號 CN114691314A 公開(公告)日 2022-07-01
申請公布號 CN114691314A 申請公布日 2022-07-01
分類號 G06F9/48(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳全;過敏意;崔煒皞;趙涵 申請(專利權)人 上海交通大學
代理機構(gòu) 上海光華專利事務所(普通合伙) 代理人 -
地址 200240上海市閔行區(qū)東川路800號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于確定性算子共存的服務調(diào)度方法及其應用的GPU,所述基于確定性算子共存的服務調(diào)度方法包括:包括:利用一共存感知的延遲預測器預測每一個算子調(diào)度組的處理時間;利用一基于余量的請求控制器以輪循的方式調(diào)度多個深度學習服務的請求,在每一個輪次中,確定接收到的所有請求的處理順序,并基于預測的所述每一個算子調(diào)度組的處理時間確定最佳的算子調(diào)度組;利用一分段模型執(zhí)行引擎處理接收到的所述算子調(diào)度組中各請求的相應算子的計算。本發(fā)明保證了多個深度學習服務混合運行的服務質(zhì)量保證,同時還提高了吞吐,提升了GPU利用率。