基于分布式強(qiáng)化學(xué)習(xí)的多小區(qū)協(xié)同波束賦形方法

基本信息

申請(qǐng)?zhí)?/td> CN202110768826.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113472472A 公開(kāi)(公告)日 2021-10-01
申請(qǐng)公布號(hào) CN113472472A 申請(qǐng)公布日 2021-10-01
分類(lèi)號(hào) H04J11/00(2006.01)I;H04W16/28(2009.01)I;H04B7/06(2006.01)I;H04B7/08(2006.01)I;G06N20/00(2019.01)I 分類(lèi) 電通信技術(shù);
發(fā)明人 高貞貞;廖學(xué)文;吳丹青;張金;羅偉 申請(qǐng)(專(zhuān)利權(quán))人 湖南國(guó)天電子科技有限公司
代理機(jī)構(gòu) 長(zhǎng)沙大珂知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 伍志祥
地址 410000湖南省長(zhǎng)沙市岳麓西大道芯城科技園3棟12層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了基于分布式強(qiáng)化學(xué)習(xí)的多小區(qū)協(xié)同波束賦形方法,包括以下步驟:為基站j建立一個(gè)權(quán)重為θj的訓(xùn)練DQN和一個(gè)權(quán)重為θ′j的目標(biāo)DQN以及一個(gè)空的經(jīng)驗(yàn)池Mj;用隨機(jī)權(quán)重初始化訓(xùn)練DQN;每隔M個(gè)時(shí)隙重復(fù)以下步驟:基站之間交互自己到所有用戶(hù)的信道狀態(tài)信息;每個(gè)基站生成未來(lái)多組M個(gè)時(shí)隙的全局信道樣本;每個(gè)基站隨機(jī)采取行動(dòng),并將相應(yīng)的經(jīng)驗(yàn)存儲(chǔ)在其經(jīng)驗(yàn)池Mj中;每個(gè)基站進(jìn)行網(wǎng)絡(luò)訓(xùn)練。本發(fā)明能在極低開(kāi)銷(xiāo)的情況下,性能優(yōu)于對(duì)比的貪婪方案和隨機(jī)方案,接近于需要全局信息的最優(yōu)方案。