視頻數(shù)據(jù)處理方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202010123747.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111340234A | 公開(公告)日 | 2020-06-26 |
申請(qǐng)公布號(hào) | CN111340234A | 申請(qǐng)公布日 | 2020-06-26 |
分類號(hào) | G06N20/00(2019.01)I | 分類 | - |
發(fā)明人 | 陳志熙 | 申請(qǐng)(專利權(quán))人 | 南京星火技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京合智同創(chuàng)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 李杰 |
地址 | 210032江蘇省南京市江北新區(qū)星火路17號(hào)創(chuàng)智大廈14樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種視頻數(shù)據(jù)處理方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)。該方法包括:基于預(yù)設(shè)的獎(jiǎng)勵(lì)預(yù)測(cè)模型,對(duì)視頻數(shù)據(jù)中,執(zhí)行主體執(zhí)行目標(biāo)任務(wù)時(shí)的任務(wù)環(huán)境進(jìn)行特征提取,生成任務(wù)環(huán)境的分布激勵(lì);基于預(yù)設(shè)的強(qiáng)化學(xué)習(xí)模型,根據(jù)任務(wù)環(huán)境,生成任務(wù)指令,根據(jù)任務(wù)指令指導(dǎo)執(zhí)行主體執(zhí)行目標(biāo)任務(wù),得到任務(wù)結(jié)果;基于預(yù)設(shè)的獎(jiǎng)勵(lì)評(píng)估函數(shù),對(duì)任務(wù)結(jié)果進(jìn)行評(píng)估,生成任務(wù)激勵(lì),并根據(jù)任務(wù)激勵(lì),對(duì)獎(jiǎng)勵(lì)預(yù)測(cè)模型的參數(shù)進(jìn)行調(diào)整;根據(jù)分布激勵(lì),對(duì)強(qiáng)化學(xué)習(xí)模型的參數(shù)進(jìn)行調(diào)整。籍此,通過強(qiáng)化學(xué)習(xí)模型生成的任務(wù)激勵(lì)對(duì)獎(jiǎng)勵(lì)預(yù)測(cè)模型的參數(shù)進(jìn)行調(diào)整,優(yōu)化獎(jiǎng)勵(lì)預(yù)測(cè)模型;通過獎(jiǎng)勵(lì)預(yù)測(cè)模型生成的分布激勵(lì)對(duì)強(qiáng)化學(xué)習(xí)模型的參數(shù)進(jìn)行調(diào)整,優(yōu)化強(qiáng)化學(xué)習(xí)模型。?? |
