基于深度強化學習的自動駕駛行為決策方法
基本信息
申請?zhí)?/td> | CN202010381846.X | 申請日 | - |
公開(公告)號 | CN111605565A | 公開(公告)日 | 2020-09-01 |
申請公布號 | CN111605565A | 申請公布日 | 2020-09-01 |
分類號 | B60W60/00(2020.01)I | 分類 | 一般車輛; |
發(fā)明人 | 楊明珠;劉相偉;李卓犖 | 申請(專利權(quán))人 | 昆山小眼探索信息科技有限公司 |
代理機構(gòu) | 北京中索知識產(chǎn)權(quán)代理有限公司 | 代理人 | 胡大成 |
地址 | 215323江蘇省蘇州市昆山市張浦鎮(zhèn)尚明甸村村民委員會 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了基于深度強化學習的自動駕駛行為決策方法,包括:獲取自動駕駛車輛周圍的當前環(huán)境狀態(tài);根據(jù)輸入的當前環(huán)境狀態(tài)和自動駕駛車輛的當前行為狀態(tài),在經(jīng)驗池中選擇并輸出自動駕駛車輛的動作行為,如果經(jīng)驗池中沒有與當前環(huán)境狀態(tài)對應(yīng)的動作行為,則由深度強化學習結(jié)構(gòu)計算并輸出自動駕駛車輛的動作行為。本發(fā)明的獲取當前環(huán)境狀態(tài)采用RGB攝像頭、紅外攝像頭和固態(tài)激光雷達,減少了傳感器的使用。通過模仿學習人類駕駛員的駕駛經(jīng)驗形成經(jīng)驗池,使得自動駕駛車輛更接近人類的駕駛習慣,有利于解決有人車和無人車在路上并存的問題,更重要的是提升了安全性。?? |
