【精选】决策论基础（单目标、多目标、不确定决策、风险决策、贝叶斯公式、效率函数和决策树基础入门知识）

您所在的位置：网站首页 › 多属性决策分析例题 › 【精选】决策论基础（单目标、多目标、不确定决策、风险决策、贝叶斯公式、效率函数和决策树基础入门知识）

【精选】决策论基础（单目标、多目标、不确定决策、风险决策、贝叶斯公式、效率函数和决策树基础入门知识）

2023-11-10 06:13| 来源: 网络整理| 查看: 265

决策论

决策论一般分为了两种类型：

单目标决策，只考虑单个方面的影响，研究单个目标函数。（对接了《战略管理》《决策管理）多目标决策，还是考虑多个方面的影响，研究多个目标函数（目标规划引入偏差或者优先级）多目标决策

首先我们要把所有的目标函数都写出来 m a x { Z 1 = f 1 ( x ) . . . Z n = f n ( x ) max\left\{ \begin{array}{l} Z_1=f_1\left( x \right)\\ ...\\ Z_n=f_n\left( x \right)\\ \end{array} \right. max⎩⎨⎧Z1=f1(x)...Zn=fn(x) x视具体情况而定，不一定是单一变量。关于解的讨论其实就是多目标进化优化里面的帕累托解，一般来说，假如是最大化，如果存在多个解在各个维度上都大于或等于大部分其他解，则这一些解就是帕累托解或者可行解

怎么对待非劣解和不能穷举的情况化多为少的方法，将多个目标转换为单个目标，例如其中目标变成一个约束或者加权求和分层序列法直接求非劣解多目标线性规划的解法层次分析法

以上的方法是经典方法，在现实生活中很难使用到，一般会使用matlab软件进行计算（数值比较），在使用机器的时候，做课题或者做科研的时候很重要的思想：蒙特卡洛思想（通过概率来研究问题）经典，不过时

与视频不同，我本人是学过一点点蒙特卡洛的思想的，而蒙特卡洛是一个赌城，所以你大概知道这是一个赌徒思想，总体来说它遵循概率里面的大数定律，就是样本越多的情况下它越有可能接近最优解。

优化在优化过程中一般都是：有最优解找最优解，没有找次优解，再没有找有效解，再没有就不求甚解（要改变模型了）…

运筹学框架：

在这里插入图片描述

单目标决策 --不确定的决策、风险决策

这个知识点本身不难，跟管理学等科目很相关，偏思想性

不确定决策（不知道不同情况具体发生的概率）

意思是我只知道我现在有多少东西，以及我的卖价和生产成本，但具体有没有顾客来买，这件事情我们是不清楚的，也就是亏不亏本也是不清楚的

这个时候我们首先将自己手上的数据进行一些处理，例如将穷举所有成本和可能卖出的数量进行建模成矩阵，我们将其分布成一个矩阵，可以叫做收益矩阵或者损失矩阵

这个时候我们就可以看成一个与自然的博弈过程，只不过这个过程，我们可以看到，这只不过是一个我们可以做出决策的一个过程

在这里插入图片描述

书本上有5个要求需要我们去思考：

乐观主义激进原则，放到数学里面，就是先找每行里面的最大值，然后选择其中最小值。

悲观主义悲观主义其实是一种保守的原则，在我损失最小情况我去找到一个最大值，在数学上来看，就是先取一个最小再取一个最大，分别对每行找一个最小的出来，，当然从我们上面来看，就是不生产。这是不合理的…

折衷（中）主义这是一个涉及程度的问题，用a来表示乐观（悲观）系数，表示乐观（悲观）的程度问题，需要利用一个这样的范式，对于每一行，站在乐观来看，我们可以得到一个数，从悲观来看，我们又可以得到一个数，最终Hi就是我们折衷的收益，这个a的取值很关键 m a x H i = a a i j ( ( max ⁡ ) ) + ( 1 − a ) a i j ( min ⁡ ) max\ \\H_i=aa_{ij\left( \left( \max \right) \right)}+\left( 1-a \right) a_{ij\left( \min \right)} max Hi=aaij((max))+(1−a)aij(min)

等可能性对于每个事件的发生，如果我们没有办法决定那一种事件更容易发生，然后我们只能基于每个事件都是等可能性去思考（古典概型），所以上面每个事件的可能性都是0.2，然后用来算期望，最后得到最大的那一个

最小机会损失准则（后悔值、遗憾值）既不是激进也不是保守们也不是等可能性，外号为“别后悔”，处理出我们能够看到我们后悔的情况，假设上面那个表格，我们假如选则事件1，相较于其他情况，我们选择S1，我们无损失，其他都有损失，所以只有选S1才最不后悔，所以从数学上来看，我们从每一列中找最大的数（代表事件的最优解），然后找到的最大的数-对应列各位的数，取绝对值（作为后悔的程度）（得到这一列中最后悔的程度），然后修正上面得到的表，再这个表的基础上，我们先取每行最大的后悔值，再在后悔值里面选一个最小值，从上面来看，我们会选择S5

风险决策（对于客观事情的发生概率不再未知）

跟上面的区别在于上面的概率是不知道的或者很难知道，而风险决策的概率是可以知道的或者不难得到的

涉及到概率，一般就涉及到了期望，所以方法有：

最大期望收益准则就是将前面的等概率改成对应的概率，就可以求解出来对应的期望，然后得到最大的期望值

最小机会损失决策准则跟概率相关了。出现期望的意味，先计算各策略的期望损失值，然后在各期望值中损失值中找到最小的。首先根据上面的情况我们算出一个后悔程度的表格，然后修改每行对应位置的概率乘以对应的值，再选择最小值

定理，假定我们原来的矩阵记为EMV，后悔矩阵记为EOL，我们可以得到如下定理

EMV + EOL =K（定值）K值如下： k = p 1 a 11 + p 2 a 22 + . . . + p n a n n k\ =\ p_1a_{11}+p_2a_{22}+...+p_na_{nn} k = p1a11+p2a22+...+pnann

全情报价值（expected value of perfect information,EVPI）在做决策之前，先做一个调查（支出成本），来确定一个概率（说法可能不够充分），如果我们按照这个结果来求最优解，会得到一个更符合最优解，但调查是需要成本。假定调查以后我们得到的收益为EPPL，没调查的收益为EMV，那么调查完以后我们的净利润（EPPL-支出）>=EMV，这里乍一看可能没有什么问题，但是其实这里存在一个悖论，那就是我压根就不知道我调查以后得到的收益是否会大于我不调查的收益，所以这里我们需要加一个角度，能不能先不进行调研，得到更新后的P1–P5，这就涉及到了贝叶斯公式。这更新的概率与真实的概率还会存在差距，但差距很小了。贝叶斯公式

主要涉及为条件概率、全概率公式和贝叶斯公式

由于本人学过贝叶斯公式，所以在这里就不赘述了，这里给出一个学习的链接：全概率公式、贝叶斯公式 - 知乎 (zhihu.com)

贝叶斯公式使用的主要特征，首先肯定知道B发生以后A发生的概率，求A发生以后B发生的概率（全集分解思想）

建议大家去看看这个视频，有些东西不好言传，只可意会：关于我强烈建议大家看看这个视频。我相信如果之前没有对贝叶斯有很深刻的了解，这个视频绝对会对大家有所帮助

【运筹学】基础教程（已完结）{适用范围：本科、考研、考博}_哔哩哔哩_bilibili

效用曲线与决策树效用函数

一般来说对于投入，就会得到一个收益，但是这个投入到收益的转换很难做到百分之一百，因为中间会有损失，所以这就涉及到了效用函数（函数），同时在这里还会涉及到了一个转化率的问题，一般来说，赚钱是开心的，亏钱是难过的，而且赚钱的开心程度比亏掉同样大小的金钱数伤心的程度要小的多。但是效用函数，一般偏向为一个对数函数，通常表示为保守型或者激进型两种曲线，经济学注重现象，管理学注重过程。

决策树

所谓决策树，数学本质上其实就是穷举法，所以决策树只能帮我们处理有限的情况。

在画决策树之前，首先我们要先做好说明，例如使用圆圈作为决策，矩形作为事件，三角形作为收益，横线表示为支出。每个决策肯定有放置或者不放置，然后就会产生一个事件，然后会产生一个反应，所以会继续做决策，做完决策以后就又会产生一个事件，然后接着做决策，直至结束。

在画完决策树，以后，我们根据树的每个枝的最叶子处进行计算（倒着算），首先根据对应的收入进行计算，选择收入最大的那个树枝，例如一个分叉的树枝，一边的期望值为7，一边的期望值为2，我们会舍弃掉为2的分支，并只记录期望值为7的分支，然后使用期望值为7继续向上进行迭代。向上迭代的过程中，不断选择期望值最大的值，最后根据期望值做出我们相应的决策

当我们加入之前所提到的效用值，我们可以将效用值当作概率进行使用，与利益相乘就可以得到相应的期望值，跟上面迭代过程一样，最终做出我们期望最大的决策

灵敏度分析

通过波动其中一些参数或者概率，来检验我们的决策的结果是否发生变化以及会发生变化范围的大小

【本文地址】

【精选】决策论基础（单目标、多目标、不确定决策、风险决策、贝叶斯公式、效率函数和决策树基础入门知识）

【精选】决策论基础（单目标、多目标、不确定决策、风险决策、贝叶斯公式、效率函数和决策树基础入门知识）

今日新闻

推荐新闻