更新Q值矩陣的方法、存儲(chǔ)介質(zhì)和終端設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN201710591451.0 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN107367929B | 公開(kāi)(公告)日 | 2021-05-04 |
申請(qǐng)公布號(hào) | CN107367929B | 申請(qǐng)公布日 | 2021-05-04 |
分類號(hào) | G05B13/02;G06N3/08 | 分類 | 控制;調(diào)節(jié); |
發(fā)明人 | 孫一鳧;吳若颯;張豪;王宗祥 | 申請(qǐng)(專利權(quán))人 | 北京上格云技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京睿派知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 劉鋒 |
地址 | 100084 北京市海淀區(qū)農(nóng)大南路1號(hào)院2號(hào)樓2層辦公B-221-A046 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┝艘环N更新Q值矩陣的方法、存儲(chǔ)介質(zhì)和終端設(shè)備,該方法包括:獲取傳感器數(shù)據(jù)并確定在Q值矩陣中對(duì)應(yīng)的第一狀態(tài);將第一狀態(tài)輸入神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)在第一狀態(tài)下遍歷Q值矩陣中所有動(dòng)作之后分別得到的在Q值矩陣中對(duì)應(yīng)的第二狀態(tài);根據(jù)第一狀態(tài)和第二狀態(tài)下所有動(dòng)作對(duì)應(yīng)的Q值,按照預(yù)設(shè)算法更新第一狀態(tài)下的所有動(dòng)作所對(duì)應(yīng)的Q值。提高了Q值矩陣的更新效率,有助于對(duì)建筑機(jī)電設(shè)備或系統(tǒng)更快找到最優(yōu)的控制策略。 |
