一種基于因果多輸出的強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)及其構(gòu)建方法

基本信息

申請?zhí)?/td> CN202110314236.2 申請日 -
公開(公告)號 CN112990437A 公開(公告)日 2021-06-18
申請公布號 CN112990437A 申請公布日 2021-06-18
分類號 G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳晨;洪錦壽;祝賀 申請(專利權(quán))人 廈門吉比特網(wǎng)絡(luò)技術(shù)股份有限公司
代理機(jī)構(gòu) 廈門市新華專利商標(biāo)代理有限公司 代理人 羅恒蘭
地址 361004 福建省廈門市軟件園二期望海路4號101室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于因果多輸出的強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),其包括神經(jīng)網(wǎng)絡(luò),該神經(jīng)網(wǎng)絡(luò)具有輸入端和輸出端,該輸入端用于輸入初始輸入狀態(tài)信息,輸出端用于輸出最終結(jié)果;所述神經(jīng)網(wǎng)絡(luò)內(nèi)設(shè)有N套級聯(lián)的AC模型,每一套AC模型具有輸入端和輸出端;兩相鄰的AC模型的輸出端輸出的結(jié)果之間存在因果關(guān)系。本發(fā)明采用了多套的AC模型,將具備因果關(guān)系的多輸出模型,拆分為序列模型,把上一個(gè)AC模型的輸出,與輸入狀態(tài)繼續(xù)合并,作為下一個(gè)AC模型的輸入。每套AC模型相互獨(dú)立,各自關(guān)注自己需要處理的輸出并向下一套AC模型進(jìn)行傳遞,最終完成全局最優(yōu)解,以此提高神經(jīng)網(wǎng)絡(luò)輸出的準(zhǔn)確率。