一種基于深度強化學習的冶金工業(yè)車間天車調(diào)度方法
基本信息
申請?zhí)?/td> | CN202111142373.9 | 申請日 | - |
公開(公告)號 | CN113837628A | 公開(公告)日 | 2021-12-24 |
申請公布號 | CN113837628A | 申請公布日 | 2021-12-24 |
分類號 | G06Q10/06(2012.01)I;G06Q10/08(2012.01)I;G06N3/08(2006.01)I;G06K9/62(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 馮凱;張云貴;馬湧;梁青艷 | 申請(專利權)人 | 中國鋼研科技集團有限公司 |
代理機構 | 北京永創(chuàng)新實專利事務所 | 代理人 | 周長琪 |
地址 | 100081北京市海淀區(qū)學院南路76號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明是一種基于深度強化學習的冶金工業(yè)車間天車調(diào)度方法,屬于車間天車調(diào)度技術領域。本發(fā)明包括:(1)獲取冶金車間內(nèi)天車所在跨區(qū)的空間布局,以及歷史天車運輸任務數(shù)據(jù)表;(2)根據(jù)跨區(qū)空間布局,以天車作為智能體,以跨區(qū)空間作為環(huán)境,創(chuàng)建天車調(diào)度的深度強化學習模型;(3)根據(jù)歷史天車運輸任務數(shù)據(jù)表,對深度強化學習模型進行參數(shù)優(yōu)化和訓練;(4)定時獲取跨區(qū)內(nèi)當前天車位置、狀態(tài),以及正在執(zhí)行和待執(zhí)行的運輸任務情況,生成環(huán)境狀態(tài)輸入訓練好的深度強化學習模型,生成天車調(diào)度方案。本發(fā)明針對冶金工業(yè)車間內(nèi)隨機產(chǎn)生或臨時變動的運輸任務,能及時生成全局優(yōu)化的調(diào)度方案,提高天車調(diào)度效率,且具有較強的魯棒性和有效性。 |
