一種基于強化學習的路徑規(guī)劃方法及裝置

基本信息

申請?zhí)?/td> CN202011263430.4 申請日 -
公開(公告)號 CN112507520A 公開(公告)日 2021-03-16
申請公布號 CN112507520A 申請公布日 2021-03-16
分類號 G06F30/20(2020.01)I;G06F17/15(2006.01)I;G06N20/00(2019.01)I 分類 計算;推算;計數;
發(fā)明人 周銳;胡文;孫佳優(yōu);葉梓豪;郭浩文 申請(專利權)人 深圳慧拓無限科技有限公司
代理機構 北京力量專利代理事務所(特殊普通合伙) 代理人 毛雨田
地址 518057廣東省深圳市南山區(qū)粵海街道麻嶺社區(qū)深南大道9966號威盛科技大廈21層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于強化學習的路徑規(guī)劃方法及裝置,通過建立環(huán)境勢能場,利用目標點的引力場和障礙物的斥力場對迭代路徑的引導作用,可以加快收斂的速度,并且可以根據環(huán)境勢能場優(yōu)化獎勵函數,從而實現獎勵函數中也體現環(huán)境勢能,即綜合原獎勵函數、目標點的引力場和障礙物的斥力場所產生的作用力的合力,來更有目的性的選取迭代路徑,得到下一狀態(tài),從而在加快迭代搜索效率的同時也能夠更加容易找到目標點,從而提高學習能力。??