一種低延遲的機(jī)器學(xué)習(xí)即服務(wù)的生成方法
基本信息
申請(qǐng)?zhí)?/td> | CN201910796537.6 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN110490334A | 公開(kāi)(公告)日 | 2019-11-22 |
申請(qǐng)公布號(hào) | CN110490334A | 申請(qǐng)公布日 | 2019-11-22 |
分類號(hào) | G06N20/00(2019.01); G06F17/50(2006.01); G06K9/62(2006.01); G06N3/08(2006.01) | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李攀登 | 申請(qǐng)(專利權(quán))人 | 上海丙晟科技有限公司 |
代理機(jī)構(gòu) | 北京盛凡智榮知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 上海丙晟科技有限公司 |
地址 | 200040 上海市靜安區(qū)靈石路718號(hào)A5幢101室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種低延遲的機(jī)器學(xué)習(xí)即服務(wù)的生成方法,模型抽象層提供了一個(gè)通用的API,可以抽象出現(xiàn)有機(jī)器學(xué)習(xí)框架和模型的異構(gòu)性;模型參數(shù)尋優(yōu)層位于模型抽象層的上方,負(fù)責(zé)動(dòng)態(tài)選擇、組合和優(yōu)化預(yù)測(cè)模型的參數(shù);模型管理層通過(guò)模型存儲(chǔ)層的信息對(duì)模型進(jìn)行管理,以實(shí)現(xiàn)應(yīng)用端可以動(dòng)態(tài)并無(wú)感知的情況下獲取最優(yōu)的預(yù)測(cè)服務(wù);事件服務(wù)層,這層負(fù)責(zé)與應(yīng)用端交互,并存儲(chǔ)應(yīng)用端用戶請(qǐng)求的信息,反饋給模型層,以實(shí)現(xiàn)動(dòng)態(tài)自動(dòng)優(yōu)化模型參數(shù);模型監(jiān)測(cè)層負(fù)責(zé)對(duì)上線模型服務(wù)的調(diào)用監(jiān)測(cè),以及時(shí)發(fā)現(xiàn)調(diào)用過(guò)程中出現(xiàn)的問(wèn)題,提高模型運(yùn)維的透明性。降低現(xiàn)有預(yù)測(cè)服務(wù)棧的復(fù)雜性,并實(shí)現(xiàn)預(yù)測(cè)服務(wù)的低延遲、高吞吐量、模型準(zhǔn)確性等關(guān)鍵屬性。 |
