一種區(qū)域多路口可變車道協(xié)同控制決策方法

基本信息

申請?zhí)?/td> CN202110677633.6 申請日 -
公開(公告)號 CN113487857A 公開(公告)日 2021-10-08
申請公布號 CN113487857A 申請公布日 2021-10-08
分類號 G08G1/01(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 信號裝置;
發(fā)明人 夏瑩杰;徐小高;朱思雨;張潔 申請(專利權(quán))人 杭州遠(yuǎn)眺科技有限公司
代理機構(gòu) 杭州華知專利事務(wù)所(普通合伙) 代理人 束曉前
地址 310012浙江省杭州市余杭區(qū)倉前街道文一西路1326號1號樓7層701-1室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種區(qū)域多路口可變車道協(xié)同控制決策方法,包括以下步驟:S1:主控臺實時獲取路網(wǎng)狀態(tài)數(shù)據(jù)、每一路口的局部狀態(tài)和上一時間步的決策動作;S2:根據(jù)績效獎勵分級評定機制構(gòu)建全局獎勵分解模塊;S3:根據(jù)區(qū)域內(nèi)可變車道的數(shù)量,確定深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練過程的狀態(tài)空間、動作空間和全局獎勵,構(gòu)建全局混合網(wǎng)絡(luò);S4:利用深度神經(jīng)網(wǎng)絡(luò)模型構(gòu)建結(jié)構(gòu)相同的訓(xùn)練網(wǎng)絡(luò)和目標(biāo)網(wǎng)絡(luò),并將兩個神經(jīng)網(wǎng)絡(luò)的參數(shù)同步;S5:根據(jù)上述收斂后的神經(jīng)網(wǎng)絡(luò)模型計算備選控制動作的效用函數(shù)值,選取最優(yōu)動作進(jìn)行可變車道轉(zhuǎn)向控制。本發(fā)明在決策時能夠去中心化地執(zhí)行自身的可變車道轉(zhuǎn)向決策,降低了計算復(fù)雜度,保證區(qū)域多路口可變車道協(xié)同控制決策的實時性和有效性。