0%

贝叶斯统计 4 决策中的收益、损失与效用

决策就是对一件事情做决定。它与推断的差别在于是否涉及后果。统计学家在做推断时是按统计理论进行的,很少或者根本不考虑推断结果在使用后的得失。度量得失的尺度就是收益函数或者是损失函数。损失函数与决策环境密切相关,因此从实际中归纳出损失函数就是决策成败的的关键。我们把损失函数引入贝叶斯推断形成贝叶斯决策论。

本章将会重点介绍收益函数、损失函数和效用函数等概念,其中还涉及到一些不用抽样信息的一些决策准则。

$\S 4.1\ $决策问题中的三要素

在现实生活中我们常常会遇到决策问题,例如囚徒困境就是经典的决策问题。在决策过程中,我们总是希望使用一种最优策略,使自己在条件有限的情况下获得最大收益或者承受最小的损失。下面我们通过一个具体的例子来定义一个决策问题,也即讨论它最基本的构成要素。

我们考虑这样一个简单的情景:

某农作物有两个品种:产量高但是抗旱能力弱的品种$\ a_1$,产量低但是抗寒能力强的品种$\ a_2$。为简化问题,先承认这样一个简单的假设:$\ \theta_1\ $表示明年雨量充沛,$\ \theta_2\ $表示明年雨量不充沛。在明年雨量不能被准确预知的情况下,农民应选播哪个品种可以最大化他的收益呢?经过历史经验的归纳总结,农民对自己的收益做了这样的预期

预期每亩收益矩阵 $a_1$:高产不抗旱 $a_2$:低产抗旱
$\theta_1$:雨量充沛 1000 200
$\theta_2$:雨量不充沛 -200 400

由上面的情景我们导出构成一个决策问题必有如下三个基本要素:

  1. 状态集$\ \Theta=\{\theta\}$,其中每个元素$\ \theta\ $表示环境(自然界、社会等)可能出现的一种状态。所有可能状态的全体组成状态集。在选播决策问题中,状态集是由两个状态组成,$\Theta=\{\theta_1,\theta_2\}$,其中$\ \theta_1\ $表示雨量充沛,$\theta_2\ $表示雨量不充沛。
  2. 行动集$\ \mathscr{A}=\{a\}$,其中$\ a\ $表示人们可能采取的一种行动。在选播决策问题中,行动集是由两个行动组成,$\mathscr{A}=\{a_1,a_2\}$,其中$\ a_1\ $表示播种高产但抗旱能力差的$(a_1)$,$a_2\ $表示播种抗旱能力强但是产量不高的$(a_2)$。
  3. 收益函数$\ Q(\theta,a)\ $度量了当环境处在状态$\ \theta$,而人们采取行动$\ a\ $时的收益。以上的预期每亩收益矩阵就是等价地给出了收益函数。

$\S 4.2\ $决策准则

行动的容许性

首先我们对行动集进行一个简单的划分。考虑这样一个问题,假如在行动集中有这样两个行动$\ a_1$和$\ a_2$,满足对于任意的状态$\ \theta$,都有$\ a_1\ $的收益不少于$\ a_2$。那么很显然,此时我们并没有必要在行动集中保留$\ a_2$,因为它永远不可能作为最优决策被选中。行动$\ a_2\ $被称为非容许行动。

基于这种想法,我们给容许行动一个定义:在给定的决策问题中,$\mathscr{A}\ $中的行动$\ a_1\ $被称为是容许的,如果在$\ \mathscr{A}\ $中不存在满足如下两个条件的行动$\ a_2$:

  1. 对所有的$\ \theta\in\Theta$,有$\ Q(\theta,a_1)>=Q(\theta,a_2)$
  2. 至少有一个$\ \theta$,可使上述不等式严格成立。

假如这样的$\ a_2\ $存在的话,则称$\ a_1\ $是非容许的。

决策准则

悲观准则

  • 对每个行动选出最小的收益
  • 在所有选出的最小收益中选取最大值。

转化为数学语言就是假如$\ a’\in\mathscr{A}$,且满足

那么我们在悲观准则下认为行动$\ a’\ $是最优行动。

悲观准则是一种保守的决策准则。它是在最不利的状态发生的情况下,尽量争取较多的利益。它也反映了决策者的决策性格或是决策者对于未来预期的一种悲观态度。

将悲观准则应用于选播问题就是

预期每亩收益矩阵 $a_1$:高产不抗旱 $a_2$:低产抗旱
$\theta_1$:雨量充沛 × 200
$\theta_2$:雨量不充沛 -200 ×

最终我们选择播种低产抗旱的品种。

乐观准则

  • 对每一个行动选取最大的收益值
  • 在所有选出的最大收益值中选取相对最大值,此最大值对应的行动就是在乐观准则下寻得的最优行动。

转化为数学语言就是假如$\ a’\in\mathscr{A}$,且满足

那么我们在乐观准则下认为行动$\ a’\ $是最优行动。

乐观准则就是设想最有利的状态发生的情况下,尽量争取最大的收益。另外这种决策准则也反映了决策者比较能够承受风险的态度。

将乐观准则应用于选播问题就是

预期每亩收益矩阵 $a_1$:高产不抗旱 $a_2$:低产抗旱
$\theta_1$:雨量充沛 1000 ×
$\theta_2$:雨量不充沛 × 400

最终我们选择播种高产不抗旱的品种作为最优行动。

此外还有折中准则,又称$\ Hurwiez\ $准则。

$\S 4.3\ $先验期望准则

Reference

《贝叶斯统计》第2版 by 茆诗松,汤银才