基于雙智能體協(xié)作博弈的雙足機(jī)器人行走控制方法和系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201911082461.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112782973A | 公開(公告)日 | 2021-05-11 |
申請(qǐng)公布號(hào) | CN112782973A | 申請(qǐng)公布日 | 2021-05-11 |
分類號(hào) | G05B13/04 | 分類 | 控制;調(diào)節(jié); |
發(fā)明人 | 王宇;鄭忠義;羅志祥;代楊仲;楊益見 | 申請(qǐng)(專利權(quán))人 | 四川省桑瑞光輝標(biāo)識(shí)系統(tǒng)股份有限公司 |
代理機(jī)構(gòu) | 四川力久律師事務(wù)所 | 代理人 | 韓洋 |
地址 | 611731 四川省成都市高新技術(shù)開發(fā)區(qū)西區(qū)西芯大道新航路1號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于雙智能體協(xié)作博弈的雙足機(jī)器人行走控制方法和系統(tǒng),包括:構(gòu)建用于提供機(jī)器人動(dòng)作控制策略的第一深度強(qiáng)化學(xué)習(xí)模塊與第二深度強(qiáng)化學(xué)習(xí)模塊;采集第一狀態(tài)參數(shù),第一深度強(qiáng)化學(xué)習(xí)模塊輸出第一最優(yōu)動(dòng)作控制策略;采集第二狀態(tài)參數(shù),第二深度強(qiáng)化學(xué)習(xí)模塊輸出第二最優(yōu)動(dòng)作控制策略;其中,第一狀態(tài)參數(shù)和第二狀態(tài)參數(shù)分別為機(jī)器人左右腿的狀態(tài)參數(shù);基于第一最優(yōu)動(dòng)作控制策略和第二最優(yōu)動(dòng)作控制策略完成對(duì)于機(jī)器人雙腿動(dòng)作的協(xié)同控制。本方法通過構(gòu)建兩個(gè)深度強(qiáng)化學(xué)習(xí)模型分別對(duì)機(jī)器人的兩腿的動(dòng)作控制策略進(jìn)行分析,通過對(duì)機(jī)器人兩條腿的單獨(dú)控制,在提高輸出動(dòng)作穩(wěn)定度的同時(shí),降低控制模型的控制維度、減小模型擬合的難度。 |
