一種基于因果多輸出的強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)及其構(gòu)建方法
基本信息
申請?zhí)?/td> | CN202110314236.2 | 申請日 | - |
公開(公告)號 | CN112990437A | 公開(公告)日 | 2021-06-18 |
申請公布號 | CN112990437A | 申請公布日 | 2021-06-18 |
分類號 | G06N3/04;G06N3/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳晨;洪錦壽;祝賀 | 申請(專利權(quán))人 | 廈門吉比特網(wǎng)絡(luò)技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 廈門市新華專利商標(biāo)代理有限公司 | 代理人 | 羅恒蘭 |
地址 | 361004 福建省廈門市軟件園二期望海路4號101室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于因果多輸出的強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),其包括神經(jīng)網(wǎng)絡(luò),該神經(jīng)網(wǎng)絡(luò)具有輸入端和輸出端,該輸入端用于輸入初始輸入狀態(tài)信息,輸出端用于輸出最終結(jié)果;所述神經(jīng)網(wǎng)絡(luò)內(nèi)設(shè)有N套級聯(lián)的AC模型,每一套AC模型具有輸入端和輸出端;兩相鄰的AC模型的輸出端輸出的結(jié)果之間存在因果關(guān)系。本發(fā)明采用了多套的AC模型,將具備因果關(guān)系的多輸出模型,拆分為序列模型,把上一個(gè)AC模型的輸出,與輸入狀態(tài)繼續(xù)合并,作為下一個(gè)AC模型的輸入。每套AC模型相互獨(dú)立,各自關(guān)注自己需要處理的輸出并向下一套AC模型進(jìn)行傳遞,最終完成全局最優(yōu)解,以此提高神經(jīng)網(wǎng)絡(luò)輸出的準(zhǔn)確率。 |
