博弈论是数学的一个分支,研究决策中的理性行为,其中结果取决于每个参与者的选择。
应用博弈论试图预测或影响任何类型竞争环境中独立行动者的决策。在日常生活中有许多场景适用博弈论,如政治、经济、商业和技术,包括区块链和加密货币。
博弈论的概念在棋类游戏中很明显,比如一方的移动可能受到对手移动的影响;或者甚至受到对手将要采取某种行动的信念的影响。
在买家和卖家之间的价格谈判中也可以看到博弈论的应用(如房地产交易)。在这些情况下,卖家会提出一个足够吸引买家的起始报价,买家可以接受报价或进入谈判。
博弈论作为一门学科出现在 20 世纪 20 年代;然而,最早的工作只关注两人、赢者通吃的场景,也就是所谓的零和游戏(下面解释)。博弈论在 1950 年代发展成为更复杂的模型,部分归功于约翰·纳什 (John Nash) 的努力。约翰·纳什 (John Nash) 因其在纳什均衡上的工作而著名地赢得了 1994 年的诺贝尔经济学奖。
纳什均衡是指游戏的结果不再能由玩家改变策略来决定的点。例如,一个简单的 2 人游戏,玩家可以选择赢得 1 美元或失去 1 美元,且任何玩家的选择都不影响另一个玩家的结果。在这种情况下,两个玩家都会逻辑上选择赢得 1 美元。知道对方的策略不会改变他们的选择。
纳什均衡,或简称均衡,是博弈论中常用的术语之一。博弈论中的其他术语和元素包括:
囚徒困境是在 1950 年代设计的,是用来说明博弈论的最常用例子之一。
在这个场景中,两个因同一罪行被囚禁的人面临一个选择——对所发生的事情保持沉默或背叛他们的犯罪伙伴。重要的是,两个罪犯不能相互通信。罪犯面临三种潜在结果:
这个困境说明了检察官如何设定游戏规则,以优化对他们有利的纳什均衡。不管另一个囚犯怎么做,每个囚犯的最佳选择都是背叛对方。如果另一个囚犯保持沉默,背叛者就会自由。如果另一个囚犯也背叛,他们都只会得到五年,而不是保持沉默的十年。
非合作游戏是玩家之间基于竞争的游戏。合作游戏包括玩家之间的合作元素,例如通过团队合作来实现结果,如足球或篮球。
非合作游戏中的博弈论检查对立玩家将如何做出决策以实现自己的目标。合作游戏中的博弈论可能预测联盟如何形成,团队可能使用哪些策略,或者如何在玩家之间分配收益。
零和游戏假设每个赢家都有一个对应的输家。足球是一种合作游戏,但足球锦标赛是一种零和游戏,只有一个团队获得奖品。
相反,非零和游戏不假设赢家和输家之间有直接的平衡,而是多种结果,对玩家有不同的收益。囚徒困境就是一个非零和游戏的例子,其中可能有多种结果,对两个囚犯都有不同的收益。
零和游戏中的博弈论相对简单,因为只有两种结果——赢或输。非零和游戏中的博弈论可能要复杂得多,涉及许多不同结果的建模。
一些游戏要求玩家同时进行移动,而其他游戏涉及按顺序进行的移动。
通常,谈判是顺序进行的,因为每一方都根据对手的最后一步提出自己的还价。然而,当两家初创公司同时推出一个可比的新产品时,它们参与的是一个同时移动的游戏。
对顺序游戏应用博弈论是分阶段进行的,因为每个玩家都会做出移动,创造一个新的结果。相比之下,对同时移动的游戏应用博弈论使用矩阵来模拟可用的结果。
博弈论的许多元素被用于区块链平台、去中心化应用(dapps)和代币的开发,作为激励良好行为的一种方式,在某些情况下,惩罚不良行为者。
区块链平台依赖于去中心化、广泛分布的节点运营商网络来维护交易的原始账本。因此,它们被设计为确保节点运营商不会尝试发起攻击来窃取资金。
像工作量证明(PoW)和权益证明(PoS)这样的共识方法融入了博弈论,要求节点在计算能力和能源消耗(对于 PoW 系统)或参与 PoS 系统的最低股份上做出相对较大的前期投资。作为回报,它们通常根据其贡献获得一部分区块奖励。然而,如果它们恶意行事,它们就有可能失去部分(或全部)的投资。
协议的规则可能会有所不同,但它们总是以这样一种方式构建的:网络参与者最理性的行动是那些服务于网络的行动。
去中心化金融(DeFi)协议,如借贷协议和去中心化交易所*,部署博弈论以吸引用户和流动性。
对于像Aave或 Compound 这样的借贷平台,玩家包括:
代币发行者使用博弈论原理设计其代币经济模型是常见做法。
例如,早期阶段分配给创始人或团队成员的代币通常受到锁定期的约束,在此期间它们不能被出售。这防止了在代币最初在交易所上市时,当时价值通常很高时,大量代币被抛售到市场上。
同样,许多项目使用空投等倡议分配代币,作为激励玩家使用他们的项目的一种方式——换句话说,为玩家创造了收益。