一種具有多智能體的神經(jīng)網(wǎng)絡提升收斂和訓練速度的方法
基本信息
申請?zhí)?/td> | CN202110192255.2 | 申請日 | - |
公開(公告)號 | CN112819144A | 公開(公告)日 | 2021-05-18 |
申請公布號 | CN112819144A | 申請公布日 | 2021-05-18 |
分類號 | G06N3/04;G06N3/08;G06N20/00;A63F13/67 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 陳晨 | 申請(專利權)人 | 廈門吉比特網(wǎng)絡技術股份有限公司 |
代理機構 | 廈門市新華專利商標代理有限公司 | 代理人 | 羅恒蘭 |
地址 | 361004 福建省廈門市軟件園二期望海路4號101室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種具有多智能體的神經(jīng)網(wǎng)絡提升收斂和訓練速度的方法、裝置、可存儲介質,其對多智能體的獎勵做出了定向的獎勵/懲罰,對于多智能體任務下的單智能體來說,當前已經(jīng)作出最優(yōu)決策的智能體被鼓勵和保留,而作出錯誤決策的智能體被定向懲罰,不會影響到其他智能體的神經(jīng)網(wǎng)絡優(yōu)化過程?;诖?,本發(fā)明中多智能體AI在反向傳播時,能夠清楚地得知出錯的智能體對象,從而在求導時只對這個對象做出懲罰,加快神經(jīng)網(wǎng)絡的收斂和訓練速度,從而進一步提升多智能體AI的效果。 |
