一種基于深度強(qiáng)化學(xué)習(xí)PPO算法的磨削恒力控制方法
基本信息
申請?zhí)?/td> | CN202210321800.8 | 申請日 | - |
公開(公告)號 | CN114660940A | 公開(公告)日 | 2022-06-24 |
申請公布號 | CN114660940A | 申請公布日 | 2022-06-24 |
分類號 | G05B13/04(2006.01)I | 分類 | 控制;調(diào)節(jié); |
發(fā)明人 | 王啟超;陳林林;孫群;賈浩磊 | 申請(專利權(quán))人 | 聊城大學(xué) |
代理機(jī)構(gòu) | 山東舜天律師事務(wù)所 | 代理人 | - |
地址 | 252000山東省聊城市湖南路1號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于深度強(qiáng)化學(xué)習(xí)PPO算法的磨削恒力控制方法,該方法首先對球形砂輪磨削過程時的末端執(zhí)行器進(jìn)行受力分析,通過力處理獲取真實磨削力;利用深度強(qiáng)化學(xué)習(xí)PPO算法訓(xùn)練當(dāng)前磨削力和預(yù)設(shè)磨削力之差與末端執(zhí)行器法向補償位移之間的關(guān)系模型,包括訓(xùn)練數(shù)據(jù)歸一化預(yù)處理、基于歐式距離的獎勵函數(shù)設(shè)計、針對性深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計與促進(jìn)算法收斂設(shè)計;基于PPO算法的控制器訓(xùn)練與磨削機(jī)器人恒力控制器使用。本發(fā)明的方法不用提前建立磨削力誤差和法向位移之間的先驗?zāi)P?,能完成平面磨削和曲面磨削時把磨削力控制在目標(biāo)磨削力內(nèi)的任務(wù),同時具有良好的自適應(yīng)能力。 |
