伽马分布

2023-03-25 10:09| 来源: 网络整理| 查看: 265

伽玛分布（Gamma Distribution）是统计学的一种连续概率函数。Gamma分布中的参数α称为形状参数（shape parameter），β称为尺度参数（scale parameter）。假设随机变量X为等到第α件事发生所需之等候时间, 密度函数为

特征函数为

Gamma的可加性编辑当两随机变量服从Gamma分布，且单位时间内频率相同时，Gamma 数学表达式若随机变量X具有概率密度其中α>0,β>0,则称随机变量X服从参数α，β的伽马分布，记作G(α,β).

性质： 1、β=n，Γ(n,α)就是Erlang分布。Erlang分布常用于可靠性理论和排队论中 ,如一个复杂系统中从第 1 次故障到恰好再出现 n 次故障所需的时间;从某一艘船到达港口直到恰好有 n 只船到达所需的时间都服从 Erlang分布； 2、当α= 1 , β = 1/λ 时，Γ(1,1/λ) 就是参数为λ的指数分布,记为exp (λ) ； 3、当α =n/2 ，β=1/2时，Γ (n/2,1/2)就是数理统计中常用的χ2( n) 分布。 4、数学期望(均值)、方差分别为对于Γ(a ,β )，E( X) =a/β，D ( X) =α / (β*β) 5、(Gamma 分布的可加性)：设随机变量 X1 , X2 , …, Xn 相互独立，并且都服从Gamma 分布，即Xi ～Γ(αi , β)，i =1 ,2 , …, n , 则： X1 + X2 + …+ Xn ～ Γ(α1 +α2 + …+αn ,β ) 其实你只要记住了Gamma function $\Gamma(\alpha) = \int_0^\infty t^{\alpha-1}e^{-t}dt$ 做积分变换 $t = \beta x$ ，可得 $\Gamma(\alpha,\beta) = \beta^\alpha\int_0^\infty x^{\alpha-1}e^{-x\beta}dx$ ，从而 $\frac{1}{\Gamma(\alpha,\beta) } \beta^\alpha\int_0^\infty x^{\alpha-1}e^{-x\beta}dx = 1$ 那么Gamma distribution 就很好记了。

并且伽马分布与一大坨分布有着暧昧的关系，比如：Erlang distribution、Chi-squared distribution、Exponential distribution、Beta distribution、Normal distribution

最后来个分布族谱图：

Gamma分布即为多个独立且相同分布（iid）的指数分布变量的和的分布。（最新修改，希望能够行文布局更有逻辑）

——————泊松过程——————指数分布和泊松分布的关系十分密切，是统计学中应用极大的两种分布。其中泊松过程是一个显著应用。

泊松过程是一个计数过程，通常用于模拟一个（非连续）事件在连续时间中发生的次数。 $\{N(t):t\geq 0\}$ 为一个泊松过程，则其满足三个性质：① $N(0)=0$ （t=0时什么都没发生）

② $N(t+s)-N(t)$ （增量）之间互相独立：扩展补充： $N(t+1)-N(t)$ 与 $N(t)-N(t-1)$ 互相独立，且在计数过程中 $Pr(N(t+1)=n_{t+1}|N(t)=n_{t},N(t-1)=n_{t-1},...,N(1)=n_{i})$ $=Pr(N(t+1)=n_{t+1}|N(t)=n_{t})$ 这是因为 $Pr(N(t+1)=n_{t+1}|N(t)=n_{t},N(t-1)=n_{t-1},...,N(1)=n_{i})$ $=Pr(N(t+1)=N(t)+n_{t+1}-n_{t}|N(t)=n_{t},N(t-1)=n_{t-1},...,N(1)=n_{i})$ $=Pr(N(t+1)=n_{t+1}|N(t)=n_{t})$

③ $Pr(N(t+s)-N(s)=n)=Pr(N(t)=n)=e^{-\lambda t} \frac{(\lambda t )^{n}}{n!}$ 即 $N(t) \sim Poi(\lambda t)$ 根据增量独立性，易知其成立。

——————泊松→指数——————假设 $T_{i}$ 为第 $i-1$ 次事件与第 $i$ 次事件的间隔时间。 $Pr(T_{1}t)=Pr(N(t)=0)=e^{-\lambda t}$ 所以 $T_{1} \sim Exp(\lambda)$

$Pr(T_{i}t|T_{i-1}=s)=Pr(N(t+s)-N(s)=0)=e^{-\lambda t}$ 所以 $T_{i} \sim Exp(\lambda)$

即泊松过程的事件间隔时间为指数分布。

——————指数→Gamma—————再令 $S_{n}=\sum_{i=1}^{n}{T_{i}}$ ，即从头开始到第 $n$ 次事件的发生的时间，该随机变量分布即为Gamma分布。即 $S_{n} \sim Gamma(n,\lambda )$ 。Gamma分布即为多个独立且相同分布（iid）的指数分布变量的和的分布。

——————证明——————假设 $X_{1},X_{2},X_{3},...X_{n}\sim Exp(\lambda )$ 且互相独立

①Moment Generating Function（MGF）：MGF的定义为 $M_{X}(t)=E[e^{tX} ]=1+tX+\frac{t^{2}X^{2}}{2!} +\frac{t^{3}X^{3}}{3!}+...\frac{t^{n}X^{n}}{n!}+...$ 则 $E[X^{n}]=M_{X}^{(n)} (0)=\frac{d^{n}M_{X}(t)}{dt} |_{t=0}$ 其性质为 $M_{X+Y}(t)=M_{X}(t)\times M_{Y}(t)$

下证： $X_{i} \sim Exp(\lambda)\Leftrightarrow M_{X_{i}}(t)=(1-\frac{t}{\lambda} )^{-1}$ $S=\sum_{i=1}^{n}{X_{i}}$ 则 $M_{S}(t)=\prod_{i=1}^{n} M_{X_{i}}(t)=\prod_{i=1}^{n} (1-\frac{t}{\lambda} )^{-1}=(1-\frac{t}{\lambda} )^{-n}$ 为Gamma分布的MGF。MGF:Moment-generating function

②数学归纳法：已知 $Gamma(1,\lambda)=Exp(\lambda)$ 所以当 $n=1$ 时成立。假设 $n\leq k$ 时 $S_{n}=\sum_{i=1}^{n}{X_{i}} \sim Gamma(n,\lambda )$ 成立当 $n=k+1$ 时， $S_{k+1}=S_{k}+X_{k+1}$ 其中 $S_{k} \sim Gamma(k,\lambda), X_{k+1} \sim Exp(\lambda)$ $Pr(S_{k+1}=x)$ $=\int_{0}^{x} Pr(S_{k}=y)Pr(X_{k+1}=x-y)dy$ $=\int_{0}^{x} \frac{\lambda^{k}}{\Gamma (k)} y^{k-1}e^{-\lambda y}\times \lambda e^{-\lambda (x-y)}dy$ $=\frac{\lambda^{k+1}}{\Gamma (k)}e^{-\lambda x}\int_{0}^{n} y^{k-1}dy$ $=\frac{\lambda^{k+1}}{\Gamma (k)}e^{-\lambda x} \frac{y^{k}}{k}|_{y=0}^{n}$ $=\frac{\lambda^{k+1}}{\Gamma (k+1)}x^{k}e^{-\lambda x}$ 为 $Gamma(k+1, \lambda)$ 的pdf。证毕。