融合深度強化學(xué)習(xí)和遺傳算法的短程支線航班調(diào)度方法

基本信息

申請?zhí)?/td> CN202111501129.7 申請日 -
公開(公告)號 CN114462664A 公開(公告)日 2022-05-10
申請公布號 CN114462664A 申請公布日 2022-05-10
分類號 G06Q10/04(2012.01)I;G06Q10/06(2012.01)I;G06Q50/30(2012.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N3/12(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 巴繼東;涂來;黃瑩;黃琛;胡志華 申請(專利權(quán))人 武漢長江通信智聯(lián)技術(shù)有限公司
代理機構(gòu) 武漢天領(lǐng)眾智專利代理事務(wù)所(普通合伙) 代理人 -
地址 430074湖北省武漢市東湖開發(fā)區(qū)關(guān)東工業(yè)園文華路2號3幢4層研發(fā)大樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了融合深度強化學(xué)習(xí)和遺傳算法的短程支線航班調(diào)度方法,DRL模塊利用編碼器提取數(shù)據(jù)在高維空間的特征表達(dá),解碼器則根據(jù)規(guī)則和概率選擇路徑,最后使用強化學(xué)習(xí)的訓(xùn)練方法更新參數(shù);訓(xùn)練并迭代了足夠多次網(wǎng)絡(luò)參數(shù)后,測試數(shù)據(jù)能通過網(wǎng)絡(luò)計算得到一系列強大的“初始解”將“初始解”所組成的“種群”將作為輸入傳入遺傳算法得到最終解。本發(fā)明有益效果:本發(fā)明深度強化學(xué)習(xí)完成了從問題輸入到問題輸出的端到端的求解方案,具有良好的泛化性;局部搜索容易陷入局部最優(yōu)陷阱,依靠DRL提供的好的初始種群可以輔助搜索過程跳出“局優(yōu)”;對于一定規(guī)模的問題,神經(jīng)網(wǎng)絡(luò)只需一次預(yù)訓(xùn)練,求解時響應(yīng)速度快,提高搜索效率,減少搜索空間和時間。