基于游戲樹搜索算法的決策模型數(shù)據(jù)處理方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202110369855.1 | 申請日 | - |
公開(公告)號 | CN112765242A | 公開(公告)日 | 2021-05-07 |
申請公布號 | CN112765242A | 申請公布日 | 2021-05-07 |
分類號 | G06F16/2458(2019.01)I | 分類 | - |
發(fā)明人 | 王嘉旸;雷捷維;李一華;任航;黃偉;熊喚亮;王命延 | 申請(專利權(quán))人 | 中至江西智能技術(shù)有限公司 |
代理機構(gòu) | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 何世磊 |
地址 | 330100江西省南昌市新建區(qū)望城新區(qū)玉壺山大道414號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于游戲樹搜索算法的決策模型數(shù)據(jù)處理方法及系統(tǒng),該方法包括:在游戲樹搜索算法的剪枝策略的設(shè)計過程中,利用雙深度Q學(xué)習算法模型預(yù)估在當前出牌決策中出每張牌對應(yīng)的分數(shù),選擇預(yù)估得分大于或等于分數(shù)閾值的出牌動作來擴展游戲樹;在游戲樹搜索算法的估值函數(shù)的設(shè)計過程中,若游戲樹搜索算法能夠在限定時間內(nèi)搜索到游戲終局,則將估值函數(shù)設(shè)置為游戲終局能夠獲取到的游戲得分,若游戲樹搜索算法不能在限定時間內(nèi)搜索到游戲終局,則利用雙深度Q學(xué)習算法模型計算當前游戲節(jié)點的每個動作的預(yù)估分數(shù),并將預(yù)估分數(shù)的最大值作為估值函數(shù)的值。本發(fā)明能夠在沒有大量高質(zhì)量玩家數(shù)據(jù)的情況下,構(gòu)建高水平的智能決策系統(tǒng)。?? |
