一種具有多智能體的神經(jīng)網(wǎng)絡提升收斂和訓練速度的方法

基本信息

申請?zhí)?/td> CN202110192255.2 申請日 -
公開(公告)號 CN112819144A 公開(公告)日 2021-05-18
申請公布號 CN112819144A 申請公布日 2021-05-18
分類號 G06N3/04;G06N3/08;G06N20/00;A63F13/67 分類 計算;推算;計數(shù);
發(fā)明人 陳晨 申請(專利權)人 廈門吉比特網(wǎng)絡技術股份有限公司
代理機構 廈門市新華專利商標代理有限公司 代理人 羅恒蘭
地址 361004 福建省廈門市軟件園二期望海路4號101室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種具有多智能體的神經(jīng)網(wǎng)絡提升收斂和訓練速度的方法、裝置、可存儲介質,其對多智能體的獎勵做出了定向的獎勵/懲罰,對于多智能體任務下的單智能體來說,當前已經(jīng)作出最優(yōu)決策的智能體被鼓勵和保留,而作出錯誤決策的智能體被定向懲罰,不會影響到其他智能體的神經(jīng)網(wǎng)絡優(yōu)化過程?;诖?,本發(fā)明中多智能體AI在反向傳播時,能夠清楚地得知出錯的智能體對象,從而在求導時只對這個對象做出懲罰,加快神經(jīng)網(wǎng)絡的收斂和訓練速度,從而進一步提升多智能體AI的效果。