如何理解指数分布？

2023-11-27 14:11| 来源: 网络整理| 查看: 265

1 泊松分布

指数分布和泊松分布息息相关，所以先简单回忆下之前介绍过的泊松分布。公司楼下有家馒头店，每天早上六点到十点营业：

老板统计了一周每日卖出的馒头（为了方便计算和讲解，缩小了数据），想从中找到一些规律：

$\begin{array}{c|c} \qquad\qquad&\qquad销售\qquad\\ \hline\color{SkyBlue}{周一}& 3 \\ \hline \color{blue}{周二}& 7 \\ \hline \color{orange}{周三}&4\\ \hline \color{Goldenrod}{周四}&6\\ \hline \color{green}{周五}&5\\\end{array}$

从中可以得到最简单的规律，均值：

$\overline{X}=\frac{3+7+4+6+5}{5}=5$

这个规律显然不够好，如果把营业时间抽象为一根线段，把这段时间用 $T$ 来表示：

然后把卖出的馒头数画在这根线段上（节约篇幅，只画出周一周二作为示意），可以看到每天卖出的馒头起伏还是很大的：

经过老板一系列的骚操作（更具体的推导请看如何理解泊松分布），最后得到每日卖出的馒头数 $X$ 服从泊松分布：

$X\sim P(\lambda),\quad \lambda=\overline{X}$

泊松分布的具体表达式为：

$P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}$

据此可以画出每日卖出馒头数的概率分布，这个规律就比均值要精细很多了：

2 馒头卖出之间的时间间隔

下面来讨论另外一个问题，馒头卖出之间的时间间隔：

可以看出也是随机变量（也就是图中的 $T_1、T_2、T_3、\cdots$ ），不过相对馒头卖出个数而言，时间间隔肯定是连续的随机变量。

如果知道这个时间间隔，老板也好调整自己的服务员人数（时间间隔短，那么需要的服务人员就多，反之需要的就少），优化成本结构。那么问题来了，这个时间间隔服从什么分布？

3 一天的间隔

既然都是卖馒头的问题，那么还是让我们从已知的泊松分布上想想办法。之前得到的泊松分布让我们知道了每天卖出的馒头数，所以下面按天来分析看看。

假如某一天没有卖出馒头，比如说周三吧，这意味着，周二最后卖出的馒头，和周四最早卖出的馒头中间至少间隔了一天：

当然也可能运气不好，周二也没有卖出馒头。那么卖出两个馒头的时间间隔就隔了两天，但无论如何时间间隔都是大于一天的：

而某一天没有卖出馒头的概率可以由泊松分布得出：

$P(X=0)=\frac{\lambda^0}{0!}e^{-\lambda}=e^{-\lambda}$

根据上面的分析，卖出两个馒头之间的时间间隔要大于一天，那么必然要包含没有卖出馒头的这天，所以两者的概率是相等的。如果假设随机变量为：

$Y=卖出两个馒头之间的时间间隔$

那么就有：

$P(Y 1)=P(X=0)=e^{-\lambda}$

4 泊松过程

之前求出的泊松分布实在限制太大，只告诉了我们每天卖出的馒头数。不过没有关系，稍微扩展下可以得到新的函数：

$P(X=k,t)=\frac{\left(\lambda t\right)^k}{k!}e^{-\lambda t}$

通过新的这个函数就可知不同的时间段内卖出的馒头数的分布了（ $t=1$ 时就是泊松分布）：

$\begin{array}{c|c} \hline \quad \quad &\quad t\quad&\quad PDF\quad\\ \hline \\ 每天卖出的馒头数 & 1 & P(X=k,1)=\frac{\lambda^k}{k!}e^{-\lambda}\\ 半天卖出的馒头数 & \frac{1}{2} & P(X=k,\frac{1}{2})=\frac{\left(\frac{1}{2}\lambda\right)^k}{k!}e^{-\frac{1}{2}\lambda}\\ 三小时卖出的馒头数 & \frac{1}{8} & P(X=k,\frac{1}{8})=\frac{\left(\frac{1}{8}\lambda\right)^k}{k!}e^{-\frac{1}{8}\lambda}\\ \\ \hline\end{array}$