基于分布式強化學習的多小區(qū)協(xié)同波束賦形方法

基本信息

申請?zhí)?/td> CN202110768826.2 申請日 -
公開(公告)號 CN113472472A 公開(公告)日 2021-10-01
申請公布號 CN113472472A 申請公布日 2021-10-01
分類號 H04J11/00(2006.01)I;H04W16/28(2009.01)I;H04B7/06(2006.01)I;H04B7/08(2006.01)I;G06N20/00(2019.01)I 分類 電通信技術;
發(fā)明人 高貞貞;廖學文;吳丹青;張金;羅偉 申請(專利權)人 湖南國天電子科技有限公司
代理機構 長沙大珂知識產(chǎn)權代理事務所(普通合伙) 代理人 伍志祥
地址 410000湖南省長沙市岳麓西大道芯城科技園3棟12層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于分布式強化學習的多小區(qū)協(xié)同波束賦形方法,包括以下步驟:為基站j建立一個權重為θj的訓練DQN和一個權重為θ′j的目標DQN以及一個空的經(jīng)驗池Mj;用隨機權重初始化訓練DQN;每隔M個時隙重復以下步驟:基站之間交互自己到所有用戶的信道狀態(tài)信息;每個基站生成未來多組M個時隙的全局信道樣本;每個基站隨機采取行動,并將相應的經(jīng)驗存儲在其經(jīng)驗池Mj中;每個基站進行網(wǎng)絡訓練。本發(fā)明能在極低開銷的情況下,性能優(yōu)于對比的貪婪方案和隨機方案,接近于需要全局信息的最優(yōu)方案。