基于分布式強化學習的多小區(qū)協(xié)同波束賦形方法
基本信息
申請?zhí)?/td> | CN202110768826.2 | 申請日 | - |
公開(公告)號 | CN113472472A | 公開(公告)日 | 2021-10-01 |
申請公布號 | CN113472472A | 申請公布日 | 2021-10-01 |
分類號 | H04J11/00(2006.01)I;H04W16/28(2009.01)I;H04B7/06(2006.01)I;H04B7/08(2006.01)I;G06N20/00(2019.01)I | 分類 | 電通信技術; |
發(fā)明人 | 高貞貞;廖學文;吳丹青;張金;羅偉 | 申請(專利權)人 | 湖南國天電子科技有限公司 |
代理機構 | 長沙大珂知識產(chǎn)權代理事務所(普通合伙) | 代理人 | 伍志祥 |
地址 | 410000湖南省長沙市岳麓西大道芯城科技園3棟12層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了基于分布式強化學習的多小區(qū)協(xié)同波束賦形方法,包括以下步驟:為基站j建立一個權重為θj的訓練DQN和一個權重為θ′j的目標DQN以及一個空的經(jīng)驗池Mj;用隨機權重初始化訓練DQN;每隔M個時隙重復以下步驟:基站之間交互自己到所有用戶的信道狀態(tài)信息;每個基站生成未來多組M個時隙的全局信道樣本;每個基站隨機采取行動,并將相應的經(jīng)驗存儲在其經(jīng)驗池Mj中;每個基站進行網(wǎng)絡訓練。本發(fā)明能在極低開銷的情況下,性能優(yōu)于對比的貪婪方案和隨機方案,接近于需要全局信息的最優(yōu)方案。 |
