伽玛分布(Gamma Distribution)是统计学的一种连续概率函数。Gamma分布中的参数α称为形状参数(shape parameter),β称为尺度参数(scale parameter)。
假设随机变量X为 等到第α件事发生所需之等候时间, 密度函数为
特征函数为
Gamma的可加性
编辑
当两随机变量服从Gamma分布,且单位时间内频率相同时,Gamma
数学表达式
若随机变量X具有概率密度
其中α>0,β>0,则称随机变量X服从参数α,β的伽马分布,记作G(α,β).
性质:
1、β=n,Γ(n,α)就是Erlang分布。Erlang分布常用于可靠性理论和排队论中 ,如一个复杂系统中从第 1 次故障到恰好再出现 n 次故障所需的时间;从某一艘船到达港口直到恰好有 n 只船到达所需的时间都服从 Erlang分布;
2、当α= 1 , β = 1/λ 时,Γ(1,1/λ) 就是参数为λ的指数分布,记为exp (λ) ;
3、当α =n/2 ,β=1/2时,Γ (n/2,1/2)就是数理统计中常用的χ2( n) 分布。
4、数学期望(均值)、方差分别为
对于Γ(a ,β ),E( X) =a/β,D ( X) =α / (β*β)
5、(Gamma 分布的可加性):设随机变量 X1 , X2 , …, Xn 相互独立,并且都服从Gamma 分布,即Xi ~Γ(αi , β),i =1 ,2 , …, n , 则:
X1 + X2 + …+ Xn ~ Γ(α1 +α2 + …+αn ,β )
其实你只要记住了Gamma function 做积分变换 ,可得 ,从而 那么Gamma distribution 就很好记了。并且伽马分布与一大坨分布有着暧昧的关系,比如:Erlang distribution、Chi-squared distribution、Exponential distribution、Beta distribution、Normal distribution 最后来个分布族谱图:
![](https://images2015.cnblogs.com/blog/1076417/201703/1076417-20170321102350565-1683482958.png)
Gamma分布即为多个独立且相同分布(iid)的指数分布变量的和的分布。(最新修改,希望能够行文布局更有逻辑)——————泊松过程——————指数分布和泊松分布的关系十分密切,是统计学中应用极大的两种分布。其中泊松过程是一个显著应用。 泊松过程是一个计数过程,通常用于模拟一个(非连续)事件在连续时间中发生的次数。 为一个泊松过程,则其满足三个性质:① (t=0时什么都没发生) ② (增量)之间互相独立:扩展补充: 与 互相独立,且在计数过程中![Pr(N(t+1)=n_{t+1}|N(t)=n_{t},N(t-1)=n_{t-1},...,N(1)=n_{i})](//www.zhihu.com/equation?tex=Pr%28N%28t%2B1%29%3Dn_%7Bt%2B1%7D%7CN%28t%29%3Dn_%7Bt%7D%2CN%28t-1%29%3Dn_%7Bt-1%7D%2C...%2CN%281%29%3Dn_%7Bi%7D%29) 这是因为![Pr(N(t+1)=n_{t+1}|N(t)=n_{t},N(t-1)=n_{t-1},...,N(1)=n_{i})](//www.zhihu.com/equation?tex=Pr%28N%28t%2B1%29%3Dn_%7Bt%2B1%7D%7CN%28t%29%3Dn_%7Bt%7D%2CN%28t-1%29%3Dn_%7Bt-1%7D%2C...%2CN%281%29%3Dn_%7Bi%7D%29) ![=Pr(N(t+1)=N(t)+n_{t+1}-n_{t}|N(t)=n_{t},N(t-1)=n_{t-1},...,N(1)=n_{i})](//www.zhihu.com/equation?tex=%3DPr%28N%28t%2B1%29%3DN%28t%29%2Bn_%7Bt%2B1%7D-n_%7Bt%7D%7CN%28t%29%3Dn_%7Bt%7D%2CN%28t-1%29%3Dn_%7Bt-1%7D%2C...%2CN%281%29%3Dn_%7Bi%7D%29) ![=Pr(N(t+1)=n_{t+1}|N(t)=n_{t})](//www.zhihu.com/equation?tex=%3DPr%28N%28t%2B1%29%3Dn_%7Bt%2B1%7D%7CN%28t%29%3Dn_%7Bt%7D%29) ③ 即 根据增量独立性,易知其成立。 ——————泊松→指数——————假设 为第 次事件与第 次事件的间隔时间。 所以![T_{1} \sim Exp(\lambda)](//www.zhihu.com/equation?tex=T_%7B1%7D+%5Csim+Exp%28%5Clambda%29) 所以![T_{i} \sim Exp(\lambda)](//www.zhihu.com/equation?tex=T_%7Bi%7D+%5Csim+Exp%28%5Clambda%29)
即泊松过程的事件间隔时间为指数分布。 ——————指数→Gamma—————再令 ,即从头开始到第 次事件的发生的时间,该随机变量分布即为Gamma分布。即 。Gamma分布即为多个独立且相同分布(iid)的指数分布变量的和的分布。 ——————证明——————假设 且互相独立 ①Moment Generating Function(MGF):MGF的定义为 则 其性质为![M_{X+Y}(t)=M_{X}(t)\times M_{Y}(t)](//www.zhihu.com/equation?tex=M_%7BX%2BY%7D%28t%29%3DM_%7BX%7D%28t%29%5Ctimes+M_%7BY%7D%28t%29) 下证:![X_{i} \sim Exp(\lambda)\Leftrightarrow M_{X_{i}}(t)=(1-\frac{t}{\lambda} )^{-1}](//www.zhihu.com/equation?tex=X_%7Bi%7D+%5Csim+Exp%28%5Clambda%29%5CLeftrightarrow+M_%7BX_%7Bi%7D%7D%28t%29%3D%281-%5Cfrac%7Bt%7D%7B%5Clambda%7D+%29%5E%7B-1%7D) 则 为Gamma分布的MGF。MGF:Moment-generating function ②数学归纳法:已知 所以当 时成立。假设 时 成立当 时, 其中![S_{k} \sim Gamma(k,\lambda), X_{k+1} \sim Exp(\lambda)](//www.zhihu.com/equation?tex=S_%7Bk%7D+%5Csim+Gamma%28k%2C%5Clambda%29%2C+X_%7Bk%2B1%7D+%5Csim+Exp%28%5Clambda%29) ![Pr(S_{k+1}=x)](//www.zhihu.com/equation?tex=Pr%28S_%7Bk%2B1%7D%3Dx%29) ![=\int_{0}^{x} Pr(S_{k}=y)Pr(X_{k+1}=x-y)dy](//www.zhihu.com/equation?tex=%3D%5Cint_%7B0%7D%5E%7Bx%7D+Pr%28S_%7Bk%7D%3Dy%29Pr%28X_%7Bk%2B1%7D%3Dx-y%29dy) ![=\int_{0}^{x} \frac{\lambda^{k}}{\Gamma (k)} y^{k-1}e^{-\lambda y}\times \lambda e^{-\lambda (x-y)}dy](//www.zhihu.com/equation?tex=%3D%5Cint_%7B0%7D%5E%7Bx%7D+%5Cfrac%7B%5Clambda%5E%7Bk%7D%7D%7B%5CGamma+%28k%29%7D+y%5E%7Bk-1%7De%5E%7B-%5Clambda+y%7D%5Ctimes+%5Clambda+e%5E%7B-%5Clambda+%28x-y%29%7Ddy) ![=\frac{\lambda^{k+1}}{\Gamma (k)}e^{-\lambda x}\int_{0}^{n} y^{k-1}dy](//www.zhihu.com/equation?tex=%3D%5Cfrac%7B%5Clambda%5E%7Bk%2B1%7D%7D%7B%5CGamma+%28k%29%7De%5E%7B-%5Clambda+x%7D%5Cint_%7B0%7D%5E%7Bn%7D++y%5E%7Bk-1%7Ddy) ![=\frac{\lambda^{k+1}}{\Gamma (k)}e^{-\lambda x} \frac{y^{k}}{k}|_{y=0}^{n}](//www.zhihu.com/equation?tex=%3D%5Cfrac%7B%5Clambda%5E%7Bk%2B1%7D%7D%7B%5CGamma+%28k%29%7De%5E%7B-%5Clambda+x%7D+%5Cfrac%7By%5E%7Bk%7D%7D%7Bk%7D%7C_%7By%3D0%7D%5E%7Bn%7D+) 为 的pdf。证毕。 当然,Gamma分布与Beta,Chi-square分布也有着十分紧密的联系,不过在统计学应用中都不如与指数分布的联系来得重要。
|