更新Q值矩陣的方法、存儲(chǔ)介質(zhì)和終端設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN201710591451.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107367929B 公開(kāi)(公告)日 2021-05-04
申請(qǐng)公布號(hào) CN107367929B 申請(qǐng)公布日 2021-05-04
分類號(hào) G05B13/02;G06N3/08 分類 控制;調(diào)節(jié);
發(fā)明人 孫一鳧;吳若颯;張豪;王宗祥 申請(qǐng)(專利權(quán))人 北京上格云技術(shù)有限公司
代理機(jī)構(gòu) 北京睿派知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 劉鋒
地址 100084 北京市海淀區(qū)農(nóng)大南路1號(hào)院2號(hào)樓2層辦公B-221-A046
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝艘环N更新Q值矩陣的方法、存儲(chǔ)介質(zhì)和終端設(shè)備,該方法包括:獲取傳感器數(shù)據(jù)并確定在Q值矩陣中對(duì)應(yīng)的第一狀態(tài);將第一狀態(tài)輸入神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)在第一狀態(tài)下遍歷Q值矩陣中所有動(dòng)作之后分別得到的在Q值矩陣中對(duì)應(yīng)的第二狀態(tài);根據(jù)第一狀態(tài)和第二狀態(tài)下所有動(dòng)作對(duì)應(yīng)的Q值,按照預(yù)設(shè)算法更新第一狀態(tài)下的所有動(dòng)作所對(duì)應(yīng)的Q值。提高了Q值矩陣的更新效率,有助于對(duì)建筑機(jī)電設(shè)備或系統(tǒng)更快找到最優(yōu)的控制策略。