視頻數(shù)據(jù)處理方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202010123747.1 申請(qǐng)日 -
公開(公告)號(hào) CN111340234A 公開(公告)日 2020-06-26
申請(qǐng)公布號(hào) CN111340234A 申請(qǐng)公布日 2020-06-26
分類號(hào) G06N20/00(2019.01)I 分類 -
發(fā)明人 陳志熙 申請(qǐng)(專利權(quán))人 南京星火技術(shù)有限公司
代理機(jī)構(gòu) 北京合智同創(chuàng)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李杰
地址 210032江蘇省南京市江北新區(qū)星火路17號(hào)創(chuàng)智大廈14樓
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開了一種視頻數(shù)據(jù)處理方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)。該方法包括:基于預(yù)設(shè)的獎(jiǎng)勵(lì)預(yù)測(cè)模型,對(duì)視頻數(shù)據(jù)中,執(zhí)行主體執(zhí)行目標(biāo)任務(wù)時(shí)的任務(wù)環(huán)境進(jìn)行特征提取,生成任務(wù)環(huán)境的分布激勵(lì);基于預(yù)設(shè)的強(qiáng)化學(xué)習(xí)模型,根據(jù)任務(wù)環(huán)境,生成任務(wù)指令,根據(jù)任務(wù)指令指導(dǎo)執(zhí)行主體執(zhí)行目標(biāo)任務(wù),得到任務(wù)結(jié)果;基于預(yù)設(shè)的獎(jiǎng)勵(lì)評(píng)估函數(shù),對(duì)任務(wù)結(jié)果進(jìn)行評(píng)估,生成任務(wù)激勵(lì),并根據(jù)任務(wù)激勵(lì),對(duì)獎(jiǎng)勵(lì)預(yù)測(cè)模型的參數(shù)進(jìn)行調(diào)整;根據(jù)分布激勵(lì),對(duì)強(qiáng)化學(xué)習(xí)模型的參數(shù)進(jìn)行調(diào)整。籍此,通過強(qiáng)化學(xué)習(xí)模型生成的任務(wù)激勵(lì)對(duì)獎(jiǎng)勵(lì)預(yù)測(cè)模型的參數(shù)進(jìn)行調(diào)整,優(yōu)化獎(jiǎng)勵(lì)預(yù)測(cè)模型;通過獎(jiǎng)勵(lì)預(yù)測(cè)模型生成的分布激勵(lì)對(duì)強(qiáng)化學(xué)習(xí)模型的參數(shù)進(jìn)行調(diào)整,優(yōu)化強(qiáng)化學(xué)習(xí)模型。??