混合博弈问题的求解与应用综述
Survey on Solutions and Applications for Mixed-motive Games作者机构:计算机软件新技术国家重点实验室(南京大学) 南京邮电大学计算机学院软件学院网络空间安全学院
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2025年第36卷第1期
页 面:107-151页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 081104[工学-模式识别与智能系统] 08[工学] 070105[理学-运筹学与控制论] 0835[工学-软件工程] 0701[理学-数学] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(62192783,62106100,62206133,62276142) 江苏省自然科学基金(BK20221441) 江苏省产业前瞻与关键核心技术竞争项目(BE2021028) 深圳市中央引导地方科技发展资金(2021Szvup056) 南京大学计算机软件新技术国家重点实验室资助项目(KFKT2022B12)
摘 要:近年来,随着人工智能技术在序贯决策和博弈对抗等问题的应用方面取得了飞速发展,围棋、游戏、德扑和麻将等领域取得了巨大的进步,例如, AlphaGo、OpenAI Five、AlphaStar、DeepStack、Libratus、Pluribus和Suphx等系统都在这些领域中达到或超过人类专家水平.这些应用集中在双人、两队或者多人的零和博弈问题中,而对于混合博弈问题的研究缺乏实质性的进展与突破.区别于零和博弈,混合博弈需要综合考虑个体收益、集体收益和均衡收益等诸多目标,被广泛应用于公共资源分配、任务调度和自动驾驶等现实场景.因此,对于混合博弈问题的研究至关重要.通过梳理当前混合博弈领域中的重要概念和相关工作,深入分析国内外研究现状和未来发展方向.具体地,首先介绍混合博弈问题的定义与分类;其次详细阐述博弈解概念和求解目标,包含纳什均衡、相关均衡、帕累托最优等解概念,最大化个体收益、最大化集体收益以及兼顾公平等求解目标;接下来根据不同的求解目标,分别对博弈论方法、强化学习方法以及这两种方法的结合进行详细探讨和分析;最后介绍相关的应用场景和实验仿真环境,并对未来研究的方向进行总结与展望.