基于深度強化學習的自動駕駛行為決策方法

基本信息

申請?zhí)?/td> CN202010381846.X 申請日 -
公開(公告)號 CN111605565A 公開(公告)日 2020-09-01
申請公布號 CN111605565A 申請公布日 2020-09-01
分類號 B60W60/00(2020.01)I 分類 一般車輛;
發(fā)明人 楊明珠;劉相偉;李卓犖 申請(專利權(quán))人 昆山小眼探索信息科技有限公司
代理機構(gòu) 北京中索知識產(chǎn)權(quán)代理有限公司 代理人 胡大成
地址 215323江蘇省蘇州市昆山市張浦鎮(zhèn)尚明甸村村民委員會
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于深度強化學習的自動駕駛行為決策方法,包括:獲取自動駕駛車輛周圍的當前環(huán)境狀態(tài);根據(jù)輸入的當前環(huán)境狀態(tài)和自動駕駛車輛的當前行為狀態(tài),在經(jīng)驗池中選擇并輸出自動駕駛車輛的動作行為,如果經(jīng)驗池中沒有與當前環(huán)境狀態(tài)對應(yīng)的動作行為,則由深度強化學習結(jié)構(gòu)計算并輸出自動駕駛車輛的動作行為。本發(fā)明的獲取當前環(huán)境狀態(tài)采用RGB攝像頭、紅外攝像頭和固態(tài)激光雷達,減少了傳感器的使用。通過模仿學習人類駕駛員的駕駛經(jīng)驗形成經(jīng)驗池,使得自動駕駛車輛更接近人類的駕駛習慣,有利于解決有人車和無人車在路上并存的問題,更重要的是提升了安全性。??