Massive MIMO的優(yōu)化方法、裝置、設(shè)備及介質(zhì)
基本信息
申請?zhí)?/td> | CN201811049938.7 | 申請日 | - |
公開(公告)號 | CN109379752B | 公開(公告)日 | 2021-09-24 |
申請公布號 | CN109379752B | 申請公布日 | 2021-09-24 |
分類號 | H04W24/02;H04W24/10;H04B7/0413;G06N3/04 | 分類 | 電通信技術(shù); |
發(fā)明人 | 喬勇 | 申請(專利權(quán))人 | 中國移動通信集團江蘇有限公司 |
代理機構(gòu) | 北京東方億思知識產(chǎn)權(quán)代理有限責任公司 | 代理人 | 尹紅敏 |
地址 | 210029 江蘇省南京市鼓樓區(qū)虎踞路59號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例提供的Massive MIMO的優(yōu)化方法、裝置、設(shè)備及介質(zhì),根據(jù)專家經(jīng)驗?zāi)J綄顟B(tài)信息矩陣的特征進行識別和判斷,確定優(yōu)化策略,在線強化學習生成多個馬克可夫決策過程MDP訓(xùn)練序列,并將MDP訓(xùn)練序列存入每個波束扇區(qū)的處理緩存中;根據(jù)異步優(yōu)勢加權(quán)的行動者?評論家Actor?Critic深度增強學習網(wǎng)絡(luò)并行計算MDP訓(xùn)練序列,并將學習到的最優(yōu)的優(yōu)化策略函數(shù)和狀態(tài)值函數(shù)的權(quán)值信息,通過全局共享模式進行更新和復(fù)制;根據(jù)行動者?評論家深度增強學習網(wǎng)絡(luò)學習到的優(yōu)化策略,確定Massive MIMO系統(tǒng)最優(yōu)的天線權(quán)值和無線參數(shù)配置組合,實現(xiàn)優(yōu)化調(diào)整與現(xiàn)網(wǎng)性能評估的在線實時交互,實時采用最優(yōu)的天線權(quán)值和無線參數(shù)配置組合,實現(xiàn)網(wǎng)絡(luò)性能最佳。 |
