基于態(tài)勢表示和行為模仿的管制指令智能生成方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202111226683.9 | 申請日 | - |
公開(公告)號 | CN113987928A | 公開(公告)日 | 2022-01-28 |
申請公布號 | CN113987928A | 申請公布日 | 2022-01-28 |
分類號 | G06F30/27(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06Q50/30(2012.01)I;G08G5/00(2006.01)I;G09B9/00(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 詹伶俐;沈德仁;鄔秋香;李翠霞;王蓓蓓;張翰文 | 申請(專利權(quán))人 | 南京萊斯信息技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 江蘇圣典律師事務(wù)所 | 代理人 | 賀翔 |
地址 | 210014江蘇省南京市秦淮區(qū)永智路8號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于態(tài)勢表示和行為模仿的管制指令智能生成方法及系統(tǒng),包括:構(gòu)建飛機(jī)表示向量的狀態(tài)空間;構(gòu)建對綜合態(tài)勢自感知表示學(xué)習(xí)的數(shù)據(jù)集;構(gòu)建綜合態(tài)勢自感知表示學(xué)習(xí)網(wǎng)絡(luò);構(gòu)建管制指令生成網(wǎng)絡(luò)的主干網(wǎng)絡(luò);采用兩階段訓(xùn)練策略對管制指令生成網(wǎng)絡(luò)進(jìn)行訓(xùn)練;級聯(lián)綜合態(tài)勢自感知表示學(xué)習(xí)的主干網(wǎng)絡(luò)和管制指令生成的主干網(wǎng)絡(luò),輸入民航自動化系統(tǒng)數(shù)據(jù),依據(jù)管制指令生成網(wǎng)絡(luò)輸出的指令動作概率,進(jìn)行采樣,輸出管制指令。本發(fā)明通過對真實(shí)扇區(qū)綜合態(tài)勢下管制行為的重演數(shù)據(jù)進(jìn)行模仿學(xué)習(xí),充分利用了人類已有的優(yōu)秀經(jīng)驗(yàn)策略指導(dǎo)指令生成網(wǎng)絡(luò)的訓(xùn)練,彌補(bǔ)了模擬環(huán)境中人為定義獎勵函數(shù)的局限性。 |
