基于Q-learning的多移動(dòng)機(jī)器人編隊(duì)方法

基本信息

申請(qǐng)?zhí)?/td> CN202111314651.4 申請(qǐng)日 -
公開(公告)號(hào) CN114047758A 公開(公告)日 2022-02-15
申請(qǐng)公布號(hào) CN114047758A 申請(qǐng)公布日 2022-02-15
分類號(hào) G05D1/02(2020.01)I 分類 控制;調(diào)節(jié);
發(fā)明人 馬蓓;薛磊;劉劍;武永寶 申請(qǐng)(專利權(quán))人 南京云智控產(chǎn)業(yè)技術(shù)研究院有限公司
代理機(jī)構(gòu) 南京眾聯(lián)專利代理有限公司 代理人 許小莉
地址 210042江蘇省南京市玄武區(qū)玄武大道108號(hào)徐莊高新區(qū)二期聚慧園五號(hào)樓7層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于Q?learning的多移動(dòng)機(jī)器人編隊(duì)方法。首先利用博弈論對(duì)多移動(dòng)機(jī)器人系統(tǒng)剛性編隊(duì)問題建模,證明了所建立的博弈模型為序數(shù)勢(shì)博弈模型,并且理論證明了納什均衡點(diǎn)的存在性。隨后,為了實(shí)現(xiàn)移動(dòng)機(jī)器人自主決策進(jìn)行編隊(duì),設(shè)計(jì)了基于Q?learning的移動(dòng)機(jī)器人博弈策略,通過求解博弈模型的納什均衡點(diǎn),實(shí)現(xiàn)多移動(dòng)機(jī)器人系統(tǒng)的剛性編隊(duì)。最后,利用Python實(shí)現(xiàn)了基于Q?learning的博弈策略,通過一系列仿真實(shí)驗(yàn),實(shí)現(xiàn)了三角形、四邊形及梯形等多種形狀的剛性編隊(duì),驗(yàn)證了所提出方法的有效性。