基于游戲樹搜索算法的決策模型數(shù)據(jù)處理方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202110369855.1 申請日 -
公開(公告)號 CN112765242A 公開(公告)日 2021-05-07
申請公布號 CN112765242A 申請公布日 2021-05-07
分類號 G06F16/2458(2019.01)I 分類 -
發(fā)明人 王嘉旸;雷捷維;李一華;任航;黃偉;熊喚亮;王命延 申請(專利權(quán))人 中至江西智能技術(shù)有限公司
代理機構(gòu) 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 何世磊
地址 330100江西省南昌市新建區(qū)望城新區(qū)玉壺山大道414號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于游戲樹搜索算法的決策模型數(shù)據(jù)處理方法及系統(tǒng),該方法包括:在游戲樹搜索算法的剪枝策略的設(shè)計過程中,利用雙深度Q學(xué)習算法模型預(yù)估在當前出牌決策中出每張牌對應(yīng)的分數(shù),選擇預(yù)估得分大于或等于分數(shù)閾值的出牌動作來擴展游戲樹;在游戲樹搜索算法的估值函數(shù)的設(shè)計過程中,若游戲樹搜索算法能夠在限定時間內(nèi)搜索到游戲終局,則將估值函數(shù)設(shè)置為游戲終局能夠獲取到的游戲得分,若游戲樹搜索算法不能在限定時間內(nèi)搜索到游戲終局,則利用雙深度Q學(xué)習算法模型計算當前游戲節(jié)點的每個動作的預(yù)估分數(shù),并將預(yù)估分數(shù)的最大值作為估值函數(shù)的值。本發(fā)明能夠在沒有大量高質(zhì)量玩家數(shù)據(jù)的情況下,構(gòu)建高水平的智能決策系統(tǒng)。??