一種基于數(shù)據(jù)挖掘的多critic強(qiáng)化學(xué)習(xí)的電力經(jīng)濟(jì)調(diào)度方法

基本信息

申請(qǐng)?zhí)?/td> CN202011165889.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112381359A 公開(kāi)(公告)日 2021-02-19
申請(qǐng)公布號(hào) CN112381359A 申請(qǐng)公布日 2021-02-19
分類號(hào) G06Q10/06(2012.01)I; 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鄭旭彬;劉林鵬;劉少偉;朱建全;馮健;王斌;丁照洋;郭志龍;鐘偉津 申請(qǐng)(專利權(quán))人 惠州蓄能發(fā)電有限公司
代理機(jī)構(gòu) 廣州粵高專利商標(biāo)代理有限公司 代理人 張金福
地址 516100廣東省惠州市博羅縣羅陽(yáng)鎮(zhèn)礤頭村
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于數(shù)據(jù)挖掘的多critic強(qiáng)化學(xué)習(xí)的電力經(jīng)濟(jì)調(diào)度方法,包括以下步驟:S1:將電力系統(tǒng)多時(shí)段經(jīng)濟(jì)調(diào)度問(wèn)題轉(zhuǎn)化為馬爾可夫決策過(guò)程;S2:獲取電力系統(tǒng)歷史數(shù)據(jù),并根據(jù)馬爾可夫決策過(guò)程構(gòu)建多critic架構(gòu)深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò);S3:利用數(shù)據(jù)挖掘方法從歷史數(shù)據(jù)中選擇樣本;S4:利用樣本更新多critic架構(gòu)深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)的參數(shù),得到優(yōu)化的電力系統(tǒng)經(jīng)濟(jì)調(diào)度策略;S5:判斷是否達(dá)到迭代結(jié)束條件;若達(dá)到,則結(jié)束迭代,得到最優(yōu)的電力系統(tǒng)經(jīng)濟(jì)調(diào)度策略;若未達(dá)到,則返回步驟S3,進(jìn)行下一輪迭代。本發(fā)明提供一種基于數(shù)據(jù)挖掘的多critic強(qiáng)化學(xué)習(xí)的電力經(jīng)濟(jì)調(diào)度方法,解決了目前用于求解電力系統(tǒng)經(jīng)濟(jì)調(diào)度問(wèn)題的方法都存在比較大的誤差的問(wèn)題。??