一種圍棋上的搜索博弈樹的策略改進方法
基本信息
申請?zhí)?/td> | CN202110760145.1 | 申請日 | - |
公開(公告)號 | CN113377779A | 公開(公告)日 | 2021-09-10 |
申請公布號 | CN113377779A | 申請公布日 | 2021-09-10 |
分類號 | G06F16/22(2019.01)I;G06F16/2457(2019.01)I;G06F16/248(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 寧義明;楊木潤;趙闖 | 申請(專利權)人 | 沈陽雅譯網(wǎng)絡技術有限公司 |
代理機構 | 沈陽新科知識產(chǎn)權代理事務所(特殊普通合伙) | 代理人 | 李曉光 |
地址 | 110004遼寧省沈陽市和平區(qū)三好街78號東軟電腦城C座11層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種圍棋上的搜索博弈樹的策略改進方法,以當前狀態(tài)為根節(jié)點建立搜索樹;選擇根節(jié)點的一個孩子節(jié)點進行模擬,如有孩子節(jié)點還沒有被模擬過,則從根節(jié)點的孩子節(jié)點里面隨機選擇一個孩子進行模擬;如所有孩子節(jié)點都被模擬過至少一次,則選擇UCB分樹最高的孩子節(jié)點;從選中的孩子節(jié)點開始模擬一直到葉子節(jié)點結束;模擬策略結合均勻采樣和極小極大策略;將模擬最后的結果反向傳播到根節(jié)點,路徑上所有葉子的動作價值函數(shù)Q值和N值被更新;重復上述步驟多次,最后選擇UCB中利用項分數(shù)最高的節(jié)點。本發(fā)明將改進算法應用在圍棋的搜索策略中,通過了GNUGo,CGOS的評測,最后的實驗結果表明該算法能提高圍棋中博弈搜索的精準度。 |
