Skip to content

博弈论基础 1

约 4625 个字 13 张图片 预计阅读时间 18 分钟

微观经济学基础

效用

效用

我们称消费者对消费组合的偏好程度为这些消费组合对消费者产生的效用(utility)。

形式化来说,记 \(\bm{x} = (x_1, \ldots, x_n)\) 表示消费者的消费组合(又称消费束),其中 \(x_i\) 表示购买 \(x_i\) 单位的物品 \(i\)

效用函数就是将消费束映射到满意程度的函数: $$ u: \mathbb{R}^n \to \mathbb{R} $$

例如一个人对 20 个钥匙扣和 5 个本子的组合的偏好程度为 10,对 15 个钥匙扣和10 个本子的组合为 15,这就说明前者的效用为 10,后者的效用为 15。

  • 只需要询问一个诚实的人,例如“你觉得 1 斤苹果和多少钱带给你的偏好是无差异的”,如此就可以得到一个消费者可以接受的价格
  • \(u\)(1 斤苹果,− 6元钱) = 0 表示 1 斤苹果和 6 元钱对消费者无差异
  • 消费者越满意,消费束对应的效用值就越高

理性人假设

理性人假设是指经济中每个参与人都会选择让自身效用最大化的行动

  • 有时理性也有其他含义,例如使用贝叶斯公式来更新行动信念
  • 理性人假设是经济学的理论研究基础,虽然饱受争议;不理性人的经济学称为行为经济学。

几类效用函数

  • 柯布-道格拉斯效用函数
    • \(u(x_1, x_2) = x_1^{\alpha} x_2^{1-\alpha}\),其中 \(\alpha \in (0, 1)\)
    • 特点:边际效用递减,具有常数弹性替代率
  • 冯诺依曼-摩根斯坦效用函数
    • \(u(L) = p \cdot u(\bm{x}) + (1-p) \cdot u(\bm{y})\),其中 \(L\) 是一个随机结果,\(p\) 是结果 \(\bm{x}\) 的概率,\(\bm{y}\) 是另一个结果
    • 用于描述不确定性下的效用,例如购买彩票 \(L\),有
      • \(p\) 的概率获得 \(\bm{x}\)\(1-p\) 的概率获得 \(\bm{y}\)
      • 那么购买这张彩票的效用等于获得 \(\bm{x}\) 与获得 \(\bm{y}\) 的效用的加权平均
    • \(u\) 是严格凹函数,则称为风险厌恶(risk-averse)
    • \(u\) 是严格凸函数,则称为风险偏好(risk-seeking)
    • \(u\) 是线性函数,则称为风险中性(risk-neutral)
  • 拟线性效用函数
    • \(u(\bm{x}, p) = v(\bm{x}) - p\)
    • 其中 \(v\) 是一个非负的效用函数,\(p\) 是支付的价格,上式表示通过价格 \(p\) 购买了消费束 \(\bm{x}\) 后的效用
    • 事实上前面的几个效用函数都是在描述 \(v\) 的形式,这里还考虑了价格的因素

边际效用递减规律

边际效用

边际效用是指消费者对某种物品的消费量每增加一单位所增加的额外满足程度。

Example

例如我们在一个很热很热很热很热的杭州的夏日吃冰淇淋解暑,我们可能会思考吃几个冰激凌对你而言最满足

数量 1 2 3 4 5 6
效用 7 12 16 18 15 10
边际效用 7 5 4 2 -3 -5
  • 在一定时间内,随着消费某种商品数量的不断增加,消费者从中得到的总效用是在增加的,但是增加的速度在递减,即边际效用是递减的
  • 当商品消费量达到一定程度后,总效用达到最大值,如果继续增加消费,总效用不但不会增加,反而会逐渐减少,此时边际效用变为负数

效用最大化问题

考虑只有两个商品的情形:设消费者的效用函数为 \(u(x_1, x_2)\),两种商品的价格分别为 \(p_1\)\(p_2\),消费者的收入为 \(p\)

这里强调了消费者的收入,这是因为在消费时消费者都有预算约束(budget constraint),因此效用最大化的目标可以写为

\[ \begin{aligned} \max\limits_{x_1, x_2} \quad & u(x_1, x_2) \\ \text{s.t. } \quad & p_1 x_1 + p_2 x_2 \leqslant p \end{aligned} \]

如果我们要求 \(u\) 关于 \(x_1\)\(x_2\) 是递增的,那么 \(u\) 取最大值时预算约束必然取等号

Example

把上面这个例子的基本思想推广,就可以得到一般情况下的消费者需求函数:

需求定律

在其他条件不变的情况下,商品的需求量与价格之间成反方向变动的关系,即价格上涨,需求量减少;价格下降,需求量增加。

当然也存在一些例外,例如吉芬商品,但这里不做讨论。

供给定律

对于正常商品来说,在其他条件不变的情况下,商品价格与供给量之间存在着正方向的变动关系,即一种商品的价格上升时,这种商品的供给量就会增加,相反,价格下降时供给量减少,这就是供给定律。

市场出清(market clearing):市场机制能够自动地消除超额供给或超额需求,市场在短期内自发地趋于供给等于需求的均衡状态。

上述均衡称为“竞争均衡”,因为其中重要的假设是厂商和消费者数量非常多,以至于他们每个人各自的行动完全无法改变整个市场的价格

社会福利

社会福利等于消费者剩余(消费者福利)加上厂商剩余(厂商福利)

  • 消费者剩余 = 买到的商品效用 - 支付
  • 厂商剩余 = 出售的收益 - 成本
  • 注意到消费者支付等同于厂商出售的收益,因此两者抵消,
  • 社会福利 = 消费者买到商品的效用 - 厂商成本

我们不难发现显然在供给曲线和需求曲线相交的位置可以实现社会福利的最大化

福利经济学第一定理

在竞争市场中,当市场供求达到均衡时,市场资源配置是社会福利最大化的。

但福利经济学第一定理成立的假设非常多:完全竞争、完全信息、无交易成本、无外部性、无规模经济等,而这些假设在现实中很难实现。在这些条件不满足的时候,就出现了市场失灵(market failure)

  • 垄断(monopoly):一个产品只有一家厂商生产,故该厂商具有市场势力,自身可以决定产品价格,从而会破坏完全竞争市场的福利最优性;
    • 垄断厂商会通过提高价格攫取更多的消费者剩余
  • 外部性(externalities):性指一个人或一群人的行动和决策使另一个人或一群人受损或受益的情况,即社会成员从事经济活动时其成本与后果不完全由该行为人承担;
    • 例如河流上游工业园区,下游渔场,工业园区排污会影响渔场的生产活动(负外部性
    • 例如植树造林不仅美化了环境,还为周围居民提供了清新的空气和休闲场所(正外部性
  • 信息不对称(asymmetric information):指交易双方掌握的信息不对称

    “柠檬” 在美国俚语中表示 “次品”或 “不中用的东西”,所以柠檬市场也称次品市场

    • 例如二手车市场中,卖家知道车的真实状况,而买家不知道,这就会导致“柠檬市场”(lemon market)现象,即劣质商品占据市场主导地位

数据的特性

  • 卖家垄断:例如 X,Meta,Google 等平台拥有大量自己独特的用户数据,因此具有垄断势力
  • 零成本复制性:使得数据出售更容易,人们更容易受到外部性的影响
  • 效用不确定性(信息不对称):
    • 买家确定数据的效用,但卖家不确定买家认为的效用
    • 卖家知道数据的价值,但买家本身不确定数据效用
    • 买家和卖家都不确定数据的效用:卖家不清楚买家下游任务,买家没看到数据内容前不确定数据质量

数据定价结合垄断可以实施价格歧视

  • 一级(完全)价格歧视:厂商完全掌握消费者偏好,将每个消费者的价格定在其最大支付意愿上,完全攫取消费者剩余
  • 三级价格歧视:根据消费者一些特征,如年龄、性别、地域等,对不同消费者群体收取不同价格(大数据杀熟,学生半价)
  • 二级价格歧视:先前的思路是收集消费者的信息做出个性化定价,而二级价格歧视是按不同的价格出售不同数量的商品,但购买相同数量产品的人都支付相同的价格
    • 例如批量购买货物时可以获得一些折扣,

博弈论:引入与基本概念

博弈论(game theory)可以被定义为对智能的理性决策者之间冲突与合作的数学模型研究

  • 价格竞争:伯川德竞争(Bertrand competition)
  • 产量竞争:古诺竞争(Cournot competition)

博弈

博弈可被表达为一个三元组 \(G = (N, (S_i)_{i \in N}, (u_i)_{i \in N})\),其中

  • \(N\) 是参与博弈的玩家(player)集合,每个参与人记为 \(i \in N\)
  • \(S_i\) 是玩家 \(i\) 的可以选择的策略(strategy)的集合
  • 报酬函数(payoff function):\(u_i: S_1 \times \cdots \times S_n \to \mathbb{R}\),表示玩家 \(i\) 在所有玩家都选择了某个策略组合时的效用
  • 上述博弈表达称为策略式博弈(strategic game),对于其他更复杂的博弈(如拓展式、不完全信息)还会有其他额外需要描述的要素
  • 这里要求博弈的参与人是理性且智能的
    • 理性是指参与人会选择最大化自身效用的行动
    • 智能人假设参与人有能力分析博弈的全局
    • 参与人都是理性、智能的是一项共同知识:我知道你知道我知道你知道...

博弈的解

博弈的解或解概念(solution concept)是对于一个博弈的一种预期结果,通常是一个策略组合,即参与人的行动选择,或收益的分配结果。

博弈论的分类

  1. 非合作博弈:参与人之间没有合作,选择行动之后效用是各自的效用,与他人无关

    • 分类依据一:是否完全信息,即参与人之间是否互相知道对方的效用函数,是否知道博弈的全局信息
    • 分类依据二:静态博弈或动态博弈,即参与人的行动是一次同时完成的,还是序贯进行的
      • 注意,如果在两个人在互相看不见的房子里进行石头剪刀布,即使要求同时完成行动,但行动的先后不会影响结果,因此这也是静态博弈

    有四大类博弈:

    1. 完全信息静态博弈:参与人互相知道对方的效用函数,且行动是同时完成的(如囚徒困境)
    2. 完全信息动态博弈:参与人互相知道对方的效用函数,且行动是序贯进行的(价格领袖模型)
    3. 不完全信息静态博弈:参与人互相不知道对方的效用函数,且行动是同时完成的(如石头剪刀布、拍卖)
    4. 不完全信息动态博弈:参与人互相不知道对方的效用函数,且行动是序贯进行的(如扑克牌)
  2. 合作博弈:考虑参与人之间合作后产生的联合效用

    • 重点关注如何分配联合效用,有很多的解概念(收益分配方式)
    • 目前广泛应用于数据估值(后续会介绍)

占优策略均衡

囚徒困境

考虑经典的囚徒困境问题:

  • 假设两个参与者都是理性的,他们会发现无论对方选不选择承认,自己选择承认都会比不承认效用更高
  • 此时我们说不承认是一个严格劣策略(strictly dominated strategy),即无论对方选择什么,自己选择这个策略总是会比另一个策略差

占优策略

给定参与人 \(i\) 的策略 \(s_i\),如果存在另一个策略 \(t_i\),使得对于任意的 \(s_{-i} \in S_{-i}\)(其他参与人的策略),都有 $$ u_i(t_i, s_{-i}) > u_i(s_i, s_{-i}) $$ 则称 \(s_i\) 是参与人 \(i\) 的一个严格劣策略(strictly dominated strategy),此时称 \(s_i\)\(t_i\) 严格占优(strictly dominated),或者说 \(t_i\) 严格占优于 \(s_i\)(strictly dominantes)。

  • 在博弈论中我们假定理性人不会选择严格劣策略
  • 在博弈论中,我们认为所有参与人都是理性的是一项共同知识
  • 因此此时囚徒困境的解(占优策略均衡)是 (承认,承认)

囚徒困境本质上在说:出于个人理性的决策无法达到社会最优(社会最优是两者都不承认)

重复剔除严格劣策略

当某个策略被另一个策略严格占优时,参与人可以直接把这个策略从自己的策略集合中剔除,得到新的博弈

有的博弈没有严格劣策略,例如:

尽管此时没有严格劣策略,但是策略 B 总是至少不比策略 T 更差,此时我们称策略 B 弱占优于(weakly dominates)策略 T。

弱占优策略

给定参与人 \(i\) 的策略 \(s_i\),如果存在另一个策略 \(t_i\),满足如下两个条件:

  1. 对于任意的 \(s_{-i} \in S_{-i}\),都有 \(u_i(t_i, s_{-i}) \geqslant u_i(s_i, s_{-i})\)(至少不差)
  2. 至少存在一个 \(s_{-i} \in S_{-i}\),使得 \(u_i(t_i, s_{-i}) > u_i(s_i, s_{-i})\)(严格好于)

则称 \(s_i\) 是参与人 \(i\) 的一个弱劣策略(weakly dominated strategy),此时称 \(s_i\)\(t_i\) 弱占优(weakly dominated),或者说 \(t_i\) 弱占优于 \(s_i\)(weakly dominates)。

  • 一般而言,除非强调严格占优,否则默认占优是指弱占优
  • 理性参与人不会使用(弱)劣策略
    • 可以用于重复剔除劣策略寻找博弈的解,但是比严格劣策略的版本对理性的要求更强

Tip

重复剔除劣策略的过程中如果只有严格劣策略,那么结果不依赖于剔除的顺序,但是剔除弱劣策略的顺序可能会影响结果

纳什均衡

不难发现,并非所有的博弈都有占优策略,例如下面的例子:

考虑策略组合 (B,R),此时每个人都不愿意单独偏离这一组合,因为此时如果只有他自己改变了策略,那么他所得到的效用就会降低,我们称这一策略组合是稳定的。

最佳应对

\(s_{-i}\) 为参与人 \(i\) 以外的所有参与人的策略组合,我们称参与人 \(i\) 的策略 \(s_i\)\(s_{-i}\) 的一个最佳应对(best response),如果满足 $$ u_i(s_i, s_{-i}) = \max\limits_{t_i \in S_i} u_i(t_i, s_{-i}) $$

纳什均衡

如果一个策略组合 \(s^* = (s_1^*, \ldots, s_n^*)\) 满足对于任意的参与人 \(i\)\(s_i^*\) 都是 \(s_{-i}^*\) 的一个最佳应对,则称这个策略组合是一个纳什均衡(Nash equilibrium)。

纳什均衡还有一个等价定义:

\[ u_i(s_i^*, s_{-i}^*) \geqslant u_i(t_i, s_{-i}^*) \quad \forall t_i \in S_i \]

离散策略求解

考虑下表所示博弈的纳什均衡:

我们本质上是求解两个人最优反应的交点,此时两个人的策略互为最优反应,比如当参与人 2 选定策略 L 时,参与人的最优反应是 M 或 B,于是我们可以把对应格子里的第一个数字圈起来;同理当参与人 1 选择策略 B 时,参与人 2 的最优反应是 L,我们把对应格子的第二个数字圈起来。

以此类推重复上述操作,表格中两个数字都被圈起来的格子就是纳什均衡。

比如在这个例子中,(B, L)、(M, L)、(T, C)、(M, R) 都是纳什均衡。

连续策略求解:古诺竞争

Example

两家制造商 1 和 2 生产相同的产品,在同一市场中竞争潜在的顾客。两家制造商同时选择产量,总产量决定产品的市场价格,市场价格对两家企业而言是相同的。用 \(q_1\)\(q_2\) 分别表示两家企业的产量,因此 \(q_1 + q_2\) 是市场的总产量。假设供给为 \(q_1 + q_2\) 时,每件产品的价格为 \(2 − q_1 − q_2\)。假设两家厂商的单位生产成本分别为正实数 \(c_1, c_2\),试求解这一博弈的纳什均衡。

这是双人博弈,每个参与人可以选择的策略集合是 \([0, +\infty)\),参与人 1 的效用(利润)为 $$ u_1(q_1, q_2) = (2 - q_1 - q_2)q_1 - c_1 q_1 = q_1(2 - q_1 - q_2 - c_1) $$ 同理参与人 2 的效用为 $$ u_2(q_1, q_2) = q_2(2 - q_1 - q_2 - c_2) $$ 我们使用最优反应的定义求解纳什均衡,首先求参与人 1 关于 \(q_2\) 的最优反应 \(R(q_2)\)(能最大化 \(u_1(q_1, q_2)\)\(q_1\)):

\[ \begin{aligned} & \dfrac{\partial u_1}{\partial q_1} = 2 - 2q_1 - q_2 - c_1 = 0 \\\\ & \implies R(q_2) = \dfrac{2 - q_2 - c_1}{2} \end{aligned} \]

不难发现 \(u_1(q_1, q_2)\) 是一个凹函数,因此一阶导数的零点就是函数的最大值点。同理有 $$ R(q_1) = \dfrac{2 - q_1 - c_2}{2} $$ 联立上面两式得到方程组:

\[ \begin{cases} q_1^* = \dfrac{2 - q_2^* - c_1}{2} \\\\ q_2^* = \dfrac{2 - q_1^* - c_2}{2} \end{cases} \]

解得 \(q_1^* = \dfrac{2 - 2c_1 + c_2}{3}\)\(q_2^* = \dfrac{2 - 2c_2 + c_1}{3}\)

Comments