融合深度強(qiáng)化學(xué)習(xí)和遺傳算法的短程支線航班調(diào)度方法

基本信息

申請(qǐng)?zhí)?/td> CN202111501129.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114462664A 公開(kāi)(公告)日 2022-05-10
申請(qǐng)公布號(hào) CN114462664A 申請(qǐng)公布日 2022-05-10
分類(lèi)號(hào) G06Q10/04(2012.01)I;G06Q10/06(2012.01)I;G06Q50/30(2012.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N3/12(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 巴繼東;涂來(lái);黃瑩;黃琛;胡志華 申請(qǐng)(專利權(quán))人 武漢長(zhǎng)江通信智聯(lián)技術(shù)有限公司
代理機(jī)構(gòu) 武漢天領(lǐng)眾智專利代理事務(wù)所(普通合伙) 代理人 -
地址 430074湖北省武漢市東湖開(kāi)發(fā)區(qū)關(guān)東工業(yè)園文華路2號(hào)3幢4層研發(fā)大樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了融合深度強(qiáng)化學(xué)習(xí)和遺傳算法的短程支線航班調(diào)度方法,DRL模塊利用編碼器提取數(shù)據(jù)在高維空間的特征表達(dá),解碼器則根據(jù)規(guī)則和概率選擇路徑,最后使用強(qiáng)化學(xué)習(xí)的訓(xùn)練方法更新參數(shù);訓(xùn)練并迭代了足夠多次網(wǎng)絡(luò)參數(shù)后,測(cè)試數(shù)據(jù)能通過(guò)網(wǎng)絡(luò)計(jì)算得到一系列強(qiáng)大的“初始解”將“初始解”所組成的“種群”將作為輸入傳入遺傳算法得到最終解。本發(fā)明有益效果:本發(fā)明深度強(qiáng)化學(xué)習(xí)完成了從問(wèn)題輸入到問(wèn)題輸出的端到端的求解方案,具有良好的泛化性;局部搜索容易陷入局部最優(yōu)陷阱,依靠DRL提供的好的初始種群可以輔助搜索過(guò)程跳出“局優(yōu)”;對(duì)于一定規(guī)模的問(wèn)題,神經(jīng)網(wǎng)絡(luò)只需一次預(yù)訓(xùn)練,求解時(shí)響應(yīng)速度快,提高搜索效率,減少搜索空間和時(shí)間。