一種基于強化學(xué)習(xí)Q-Learning的模糊控制“云做青”智能算法

基本信息

申請?zhí)?/td> CN202110740746.6 申請日 -
公開(公告)號 CN113485104A 公開(公告)日 2021-10-08
申請公布號 CN113485104A 申請公布日 2021-10-08
分類號 G05B13/04(2006.01)I 分類 控制;調(diào)節(jié);
發(fā)明人 鄧勇;李宏發(fā);連紀(jì)文;鄭蔚濤;王棟;陳漢城;劉璐;陳行濱;黃銳;李霄銘;李棋;林旭軍;熊軍;陳卓琳;余翔;翁曉鋒;江秀;潘丹;林棟;許高術(shù);楊啟帆;楊勁懷;吳茜;謝景宇;林靈婷;陳豪;丁寧;林嘉;樂藝澤;謝丹鴻 申請(專利權(quán))人 福建省億力信息技術(shù)有限公司
代理機構(gòu) 福州元創(chuàng)專利商標(biāo)代理有限公司 代理人 陳明鑫;蔡學(xué)俊
地址 350003福建省福州市鼓樓區(qū)五四路257號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于強化學(xué)習(xí)Q?Learning的模糊控制“云做青”智能算法。首先,將制茶時的環(huán)境信息模糊化后作為做青模糊強化系統(tǒng)規(guī)則庫中模糊規(guī)則的前件,通過強化學(xué)習(xí)系統(tǒng)獲取模糊規(guī)則的結(jié)論即模糊規(guī)則的后件,并將做青桶包括轉(zhuǎn)動方向、轉(zhuǎn)動程度、轉(zhuǎn)動時間的不同組合作為強化學(xué)習(xí)系統(tǒng)的動作集,每一條模糊規(guī)則的后件為強化學(xué)習(xí)系統(tǒng)的動作集中的一個;其次,建立做青模糊強化系統(tǒng)規(guī)則庫,即每條模糊規(guī)則的前件分別對應(yīng)動作集中的所有動作,并作為該條模糊規(guī)則可能的后件,同時為每一個動作分配一個函數(shù)作為動作的評估值;通過更新每條模糊規(guī)則可能動作的值,在學(xué)習(xí)之后選擇模糊規(guī)則中的具有最大值的動作作為模糊規(guī)則的結(jié)論,從而得到最終的模糊控制輸出。