不确定环境下的博弈模型与群体行为动态演化
博弈论是一门研究策略性决策行为的社会科学分支。上世纪 40年代,von
Neuman与Morgenstern在研究人类经济行为时首次将博弈论纳入规范的决策分 析框
架。
其后,Nash利用不动点定理从数学上证明了博弈均衡的一般存在性
,为博弈
论的一般化奠定了坚实的基础。经过几十年的发展 , 博弈论逐渐被广泛应用于生 态学、社会学、经济学、政治学、国际关系、军事战略等诸多学科和领域 , 成为 现代科学的一块重要基石。
传统的博弈论是建立在概率的基础上的 , 具有处理随机不确定性的能力。但 是, 海森堡不确定性原理和混沌理论等研究表明 , 不确定性是现实世界的本质属 性, 不确定性不只是概率意义上的随机性。
博弈中的决策主体往往要在不确定条件下进行决策 ,参与人可能 :不能确定 环境的客观参数 ;对博弈中发生的事件不很清楚 ; 不能确定别的不确定参与人的 行动 ; 不能确定别的参与人的推理等等。 随着不确定性推理理论的发展 , 不确定性 有了更为复杂和丰富的内涵。
对此, 本文以不确定环境下的博弈模型与群体行为动态演化为主要研究内容 探讨了博弈论在不确定环境下的建模和应用问题。 本文的主要研究成果包括以下 几个方面。
1、考虑到语义条件下事物可能具有的多义性 , 采用 Dempster-Shafer 证据理
论对其进行表示和建模 , 研究了多义性环境下的不确定零和矩阵博弈以及该环境 下的竞争式多准则决策问题。针对支付矩阵不确定条件下的双人零和矩阵博弈 , 提出了一种零和信度结构矩阵博弈模型 ,并利用语言变量转换的方法一步步地分 离
信度结构支付矩阵中包含的冲突和非特异性 , 以将其转化为区间数据矩阵博弈 问题进行求解。
然后, 进一步研究了双人零和矩阵博弈的一种推广形式—零和多矩阵博弈中 包含的连接不确定性 , 提出了一种信度结构连接零和多矩阵博弈模型 , 并借助推 广的最大最小定理以及确定性零和多矩阵博弈的线性规划解法探讨了所提出模 型的解等相关问题。 本文提出的这两种不确定零和博弈模型是对基本的零和矩阵 博弈的扩展 , 丰富和完善了零和矩阵博弈在不确定环境中的理论研究。
最后,针对含有多义性且存在多个竞争决策主体的不确定决策问题 , 提出了 一种基于证据理论和博弈论的多义性环境竞争式多准则决策框架 , 为此类问题提 供了一个可操作的解决流程 , 易于实际应用和进一步扩展。 2、以概率表示个体行 为和状态的随机不确定性 , 在网络演化博弈的框架下研究了理性个体间群体合作 行为的涌现和进化机制。
首先考察了偏好选择不确定情况下的网络演化博弈 , 提出了一种自适应的
WSLS(Win-Stay-Lose-Shift) 偏好选择机制。 在该机制下 , 个体自适应地遵循
“赢 存输变”的原则, 根据当前局部信息实时地、 动态地确定候选学习对象 ,更加合理 地反映了演化过程中个体期望收益水平的差异性和时变性。
演化的囚徒困境博弈和公共物品博弈仿真实验表明 , 该机制确实能够有效提 升结构化种群中合作的水平 , 为促进种群合作提供了一种新的设计机制。然后 , 以演化的者博弈为实验框架 , 系统地研究了基于达尔文渐进进化主义和基于 断续平衡理论的两类策略更新机制下 , 利他行为这一合作的特殊形式在多种同质 或异质的结构化种群中的形成与涌现。
并考察角色分配的不确定性对种群演化结果的影响 , 研究了度高的个体扮演 者还是度低的个体扮演者更有利于提升种群的利他性和降低收益的不 平等性,
为理解不同底层机制下的生物和社会系统的演化和运行规律提供了更为 全面的借鉴和参考。 3、基于 Eisert-Wilkens-Lewenstein 与 Marinatto-Weber 两种量子博弈机制 , 研究了量子不确定环境下的量子博弈模型以及其与经典博弈 在双层网络上的共演化对群体合作行为的影响。
作为经典概率的兼容性推广 , 量子概率表征了更深层次的不确定性。已有的 研究发现 , 量子博弈在很多情况下展现出与经典博弈模型完全不同的特性。
本文首先对监督博弈进行量子化 ,分析了它的各种均衡情况。 研究表明,量子 化操作具有分别提高博弈各参与人收益的能力 , 但并不能同时提升所有参与人的 收益, 因此无法实现经典监督博弈均衡的帕累托改进。
同时,研究了三类观点形成博弈的量子化 , 发现某些类型的观点形成博弈在 合适的纠缠初始态的条件下可以无条件地产生非零和的、共赢的均衡
, 进而有利
于公共观点的形成。此外 , 将基于经典博弈模型的单层网络上的网络演化博弈扩 展到双层网络上 ,以量子纠缠度与网络耦合系数为变化参数 , 研究了经典囚徒博 弈与量子囚徒博弈在双层网络上的共演化对群体合作行为的影响 , 并探讨了如何 提高广义的合作在双层耦合网络中的水平 , 丰富了网络演化博弈的研究。
4、经典的博弈论是建立在完全理性这一假设之上的 ,Maynard Smith 和 Price
将自然选择和变异引入博弈论 , 在有限理性的条件下建立了演化博弈论。本文最 后研究了演化博弈论在不确定环境中的应用问题。
首先,将演化博弈论应用于不确定多源信息融合问题 , 构建了 Jaccard 矩阵 博弈, 并在其上基于复制动态方程提出了一种演化组合规则以实现多个证据的融 合,用一些典型悖论验证了提出方法的有效性。 然后, 对信息源选择问题进行研究 提出了一种信息源选择博弈 ,并分析了它的一些基本性质 , 建立了基于复制动态 的信息源选择模型 , 以两信息源和三信息源的选择为例说明并分析了所提出的新 模型。
最后,考察了演化博弈论框架下的二元观点动力学 , 基于协调博弈建立了
BSO BDC两种观点交互模型,并在复制者动态的基础上分析了观点偏好和骑墙者
对二元观点演化的影响。这些工作一方面丰富了演化博弈论的应用研究 , 另一方 面也对所关注的具体问题提供了新的解决方案和研究思路。