咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种大众麻将计算机博弈的快速出牌方法 收藏

一种大众麻将计算机博弈的快速出牌方法

A fast discard method of public mahjong computer game

作     者:张小川 严明珠 涂飞 陈俊宇 魏乐天 ZHANG Xiaochuan;YAN Mingzhu;TU Fei;CHEN Junyu;WEI Letian

作者机构:重庆理工大学两江人工智能学院重庆401120 

出 版 物:《重庆理工大学学报(自然科学)》 (Journal of Chongqing University of Technology:Natural Science)

年 卷 期:2024年第38卷第5期

页      面:102-107页

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金项目(60443004) 重庆市技术创新与应用发展专项项目(cstc2021jscx-dxwtBX0019) 

主  题:计算机博弈 不完美信息博弈 麻将 启发式快速出牌 蒙特卡洛评估法 

摘      要:麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何在对弈中快速出牌就成为主要问题。针对以上问题,对出牌动作进行研究,以启发式快速出牌为思路,提出了面向敌方胡牌牌张的蒙特卡洛评估法,将启发式快速出牌方法和蒙特卡洛评估法相结合,对每张手牌进行估值计算,通过估值分数决定每轮出牌牌张。以历史出牌次数为分界点,以此分界将博弈过程时序化为前后2个决策时段,前段采用启发式快速出牌方法,后段采用蒙特卡洛评估法。通过前后时段法分层递进决策处理过程,给出最佳出牌着法,能有效减少出牌的决策时间并降低点炮率。采用所提方法的程序在中国计算机博弈锦标赛中获得了一等奖,证明了该方法的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分