一種基于強化學習的路徑規(guī)劃方法及裝置
基本信息
申請?zhí)?/td> | CN202011263430.4 | 申請日 | - |
公開(公告)號 | CN112507520A | 公開(公告)日 | 2021-03-16 |
申請公布號 | CN112507520A | 申請公布日 | 2021-03-16 |
分類號 | G06F30/20(2020.01)I;G06F17/15(2006.01)I;G06N20/00(2019.01)I | 分類 | 計算;推算;計數; |
發(fā)明人 | 周銳;胡文;孫佳優(yōu);葉梓豪;郭浩文 | 申請(專利權)人 | 深圳慧拓無限科技有限公司 |
代理機構 | 北京力量專利代理事務所(特殊普通合伙) | 代理人 | 毛雨田 |
地址 | 518057廣東省深圳市南山區(qū)粵海街道麻嶺社區(qū)深南大道9966號威盛科技大廈21層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于強化學習的路徑規(guī)劃方法及裝置,通過建立環(huán)境勢能場,利用目標點的引力場和障礙物的斥力場對迭代路徑的引導作用,可以加快收斂的速度,并且可以根據環(huán)境勢能場優(yōu)化獎勵函數,從而實現獎勵函數中也體現環(huán)境勢能,即綜合原獎勵函數、目標點的引力場和障礙物的斥力場所產生的作用力的合力,來更有目的性的選取迭代路徑,得到下一狀態(tài),從而在加快迭代搜索效率的同時也能夠更加容易找到目標點,從而提高學習能力。?? |
