数学期望(均值)、方差、协方差、相关系数和矩

您所在的位置:网站首页 协方差与协方差矩阵 数学期望(均值)、方差、协方差、相关系数和矩

数学期望(均值)、方差、协方差、相关系数和矩

2024-07-10 07:30| 来源: 网络整理| 查看: 265

文章目录 1 前言2 数学期望(均值)、方差,矩、协方差和相关系数2.1 数学期望(均值)2.2 方差2.3 协方差2.4 相关系数2.5 矩

1 前言

随机变量的分布函数完整地描述了随机变量取值的统计规律,然而在一些实际问题中要确定某些随机变量的分布函数却是非常困难的,有时甚至是不可能的。不过在一些实际的问题中,并不需要完整、全面地考察随机变量的统计规律,而只需要直到它的某些特征。随机变量常用的数字特征有:数学期望((均值)方差,矩、协方差和相关系数

数学期望描述了随机变量的平均取值,其完全取决于随机变量的分布情况。方差描述了随机变量的取值与其数学期望的偏离程度。对于多维随机变量的情况,协方差与相关系数刻画了每个随机变量的相关性。 更一般的随机变量的数字特征称为“矩”,数学期望是一阶原点矩;方差是二阶中心矩;协方差是二阶混合中心距。通过矩,可以定义协方差矩阵,简化多维随机变量的概率密度函数的处理。

2 数学期望(均值)、方差,矩、协方差和相关系数

下面考虑的是各个数字特征都存在的情况。

2.1 数学期望(均值)

离散型随机变量的数学期望:

设 X X X为离散型随机变量,其分布律为 P ( X = x k ) = p k , k = 0 , 1 , 2 , . . . P(X=x_k)=p_k,k=0,1,2,... P(X=xk​)=pk​,k=0,1,2,...。则离散型随机变量 X X X的数学期望(均值)为: E ( X ) = ∑ k = 0 ∞ x k p k E(X)=\sum_{k=0}^{\infty} x_{k} p_{k} E(X)=k=0∑∞​xk​pk​

连续型随机变量的数学期望:

设 X X X为连续型随机变量,其概率密度函数为 f ( x ) f(x) f(x)。则连续型随机变量 X X X的数学期望(均值)为: E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X)=\int_{-\infty}^{\infty} x f(x) \mathrm{d} x E(X)=∫−∞∞​xf(x)dx

随机变量函数的数学期望: 设 Y = g ( X ) Y=g(X) Y=g(X)为随机变量 X X X的函数。 (1)若 X X X是离散型随机变量,其分布律为 P ( X = x k ) = p k , k = 0 , 1 , 2 , . . . P(X=x_k)=p_k,k=0,1,2,... P(X=xk​)=pk​,k=0,1,2,...,则离散型随机变量的函数 Y Y Y的期望为: E ( Y ) = E [ g ( X ) ] = ∑ k = 0 ∞ g ( x k ) p k E(Y)=E[g(X)]=\sum_{k=0}^{\infty} g\left(x_{k}\right) p_{k} E(Y)=E[g(X)]=k=0∑∞​g(xk​)pk​

(2)若 X X X是连续型随机变量,其概率密度为 f ( x ) f(x) f(x),则连续型随机变量的函数 Y Y Y的期望为: E ( Y ) = E [ g ( X ) ] = ∫ − ∞ ∞ g ( x ) f ( x ) d x E(Y)=E[g(X)]=\int_{-\infty}^{\infty} g(x) f(x) \mathrm{d} x E(Y)=E[g(X)]=∫−∞∞​g(x)f(x)dx

对于多维度的情况,比如 令 Z = g ( X , Y ) Z=g(X,Y) Z=g(X,Y)为二维随机变量 ( X , Y ) (X,Y) (X,Y)的函数 。

(1)若 ( X , Y ) (X,Y) (X,Y) 是二维离散型随机变量,分布律为 P ( X = x i , Y = y i ) = p i j , i , j = 0 , 1 , 2 , . . . P(X=x_i,Y=y_i)=p_{ij},i,j=0,1,2,... P(X=xi​,Y=yi​)=pij​,i,j=0,1,2,...,则有: E ( Z ) = E [ g ( X , Y ) ] = ∑ j = 0 ∞ ∑ i = 0 ∞ g ( x i , y i ) p i j E(Z)=E[g(X, Y)]=\sum_{j=0}^{\infty} \sum_{i=0}^{\infty} g\left(x_{i}, y_{i}\right) p_{i j} E(Z)=E[g(X,Y)]=j=0∑∞​i=0∑∞​g(xi​,yi​)pij​

(2)若 ( X , Y ) (X,Y) (X,Y) 是二维连续型随机变量,其概率密度函数为 f ( x , y ) f(x,y) f(x,y),则有: E ( Z ) = E [ g ( X , Y ) ] = ∫ − ∞ ∞ ∫ − ∞ ∞ g ( x , y ) f ( x , y ) d x d y E(Z)=E[g(X, Y)]=\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} g(x, y) f(x, y) d x d y E(Z)=E[g(X,Y)]=∫−∞∞​∫−∞∞​g(x,y)f(x,y)dxdy 数学期望的性质:

(1)设 C C C是常数,则 E ( C ) = C E(C)=C E(C)=C

(2)设 C C C是常数, X X X是一个随机变量, 则有 E ( C X ) = C E ( X ) E(CX)=CE(X) E(CX)=CE(X)

(3)设 X , Y X,Y X,Y是两个随机变量,则有 E ( X + Y ) = E ( X ) + E ( Y ) E(X+Y)=E(X)+E(Y) E(X+Y)=E(X)+E(Y)可以推广到任意多个随机变量的情形,比如对于 n n n个随机变量 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1​,X2​,...,Xn​,有:

E ( X 1 + X 2 + . . . + X n ) = E ( X 1 ) + E ( X 2 ) + . . . + E ( X n ) E(X_1+X_2+...+X_n)=E(X_1)+E(X_2)+...+E(X_n) E(X1​+X2​+...+Xn​)=E(X1​)+E(X2​)+...+E(Xn​)

再结合(1)(2),有: E ( k 1 X 1 + k 2 X 2 + . . . + k n X n + c ) = k 1 E ( X 1 ) + k 2 E ( X 2 ) + . . . + k n E ( X n ) + C E(k_1X_1+k_2X_2+...+k_nX_n+c)=k_1E(X_1)+k_2E(X_2)+...+k_nE(X_n)+C E(k1​X1​+k2​X2​+...+kn​Xn​+c)=k1​E(X1​)+k2​E(X2​)+...+kn​E(Xn​)+C 其中 k 1 , k 2 , . . . , k n k_1,k_2,...,k_n k1​,k2​,...,kn​以及 C C C为任意常数

(4)设 X , Y X,Y X,Y是相互独立的随机变量,则有 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y),可以推广到任意多个随机变量的情形,比如对于 n n n个相互独立的随机变量 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1​,X2​,...,Xn​,有:

E ( X 1 , X 2 , . . . , X n ) = E ( X 1 ) E ( X 2 ) . . . E ( X n ) E(X_1,X_2,...,X_n)=E(X_1)E(X_2)...E(X_n) E(X1​,X2​,...,Xn​)=E(X1​)E(X2​)...E(Xn​)

2.2 方差

设 X X X是一个随机变量,其方差为: D ( X ) = E ( [ X − E ( X ) ] 2 ) D(X)=E([X-E(X)]^{2}) D(X)=E([X−E(X)]2) D ( X ) \sqrt{D(X)} D(X) ​称为 X X X的标准差或均方差。

随机变量 X X X的方差反应了 X X X的取值与其数学期望的偏离程度。若方差较小,则 X X X的取值较集中;否则, X X X的取值就比较分散。因此,方差 D ( X ) D(X) D(X)是刻画 X X X取值分散程度的一个量。

方差本质上是随机变量 X X X的函数 g ( X ) = ( X − E ( X ) ) 2 g(X)=(X-E(X))^{2} g(X)=(X−E(X))2的期望。

(1)若 X X X为离散型随机变量,其分布律为 P ( X = x k ) = p k , k = 0 , 1 , . . . P(X=x_k)=p_k,k=0,1,... P(X=xk​)=pk​,k=0,1,...,则 D ( X ) = ∑ k = 0 ∞ [ x k − E ( x ) ] 2 p k D(X)=\sum_{k=0}^{\infty}[x_k-E(x)]^2p_k D(X)=k=0∑∞​[xk​−E(x)]2pk​

(2)若 X X X为离散型随机变量,其概率密度为 f ( x ) f(x) f(x),则:

D ( X ) = ∫ − ∞ ∞ [ x − E ( X ) ] 2 f ( x ) d x D(X)=\int_{-\infty}^{\infty}[x-E(X)]^{2} f(x) \mathrm{d} x D(X)=∫−∞∞​[x−E(X)]2f(x)dx

另外,方差还可以这样算: D ( X ) = E { [ X − E ( X ) ] 2 } = E { X 2 − 2 X E ( X ) + [ E ( X ) ] 2 } = E ( X 2 ) − 2 E ( X ) E ( X ) + [ E ( X ) ] 2 = E ( X 2 ) − [ E ( X ) ] 2 \begin{aligned}D(X) &=E\left\{[X-E(X)]^{2}\right\}=E\left\{X^{2}-2 X E(X)+[E(X)]^{2}\right\} \\&=E\left(X^{2}\right)-2 E(X) E(X)+[E(X)]^{2} \\&=E\left(X^{2}\right)-[E(X)]^{2}\end{aligned} D(X)​=E{[X−E(X)]2}=E{X2−2XE(X)+[E(X)]2}=E(X2)−2E(X)E(X)+[E(X)]2=E(X2)−[E(X)]2​

方差的性质: (1) 设 C C C是一个常数,则 D ( C ) = 0 D(C)=0 D(C)=0;

(2) D ( X ) = 0 ⇔ P { X = E ( X ) } = 1 D(X)=0 \Leftrightarrow P\{X=E(X)\}=1 D(X)=0⇔P{X=E(X)}=1

(3)设 C C C是一个随机变量, a , b a,b a,b为常数,则有 D ( a X + b ) = a 2 D ( X ) D(aX+b)=a^2D(X) D(aX+b)=a2D(X)

(4)若 X , Y X,Y X,Y相互独立,则 D ( X ± Y ) = D ( X ) + D ( Y ) D(X \pm Y)=D(X)+D(Y) D(X±Y)=D(X)+D(Y),反之不成立。

结合(3)和(4),若 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1​,X2​,...,Xn​相互独立,则有: D ( k 1 X 1 + k 2 X 2 + ⋯ + k n X n ) = k 1 2 D ( X 1 ) + k 2 2 D ( X 2 ) + ⋯ + k n 2 D ( X n ) D\left(k_1X_{1}+k_2X_{2}+\cdots+k_nX_{n}\right)=k_1^2D\left(X_{1}\right)+k_2^2D\left(X_{2}\right)+\cdots+k_n^2D\left(X_{n}\right) D(k1​X1​+k2​X2​+⋯+kn​Xn​)=k12​D(X1​)+k22​D(X2​)+⋯+kn2​D(Xn​)

2.3 协方差

设 ( X , Y ) (X,Y) (X,Y)是一个二维随机变量,随机变量 X X X和 Y Y Y的协方差为: C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\} Cov(X,Y)=E{[X−E(X)][Y−E(Y)]} 若 ( X , Y ) (X,Y) (X,Y)是离散型随机变量,其分布律为 P ( X = x i , Y = y i ) = p i j , i , j = 1 , 2 , . . . P(X=x_i,Y=y_i)=p_{ij},i,j=1,2,... P(X=xi​,Y=yi​)=pij​,i,j=1,2,...,则 C o v ( X , Y ) = ∑ i = 1 ∞ ∑ j = 1 ∞ [ x i − E ( X ) ] [ y j − E ( Y ) ] p i j Cov(X,Y)=\sum_{i=1}^{\infty}\sum_{j=1}^{\infty}[x_i-E(X)][y_j-E(Y)]p_{ij} Cov(X,Y)=i=1∑∞​j=1∑∞​[xi​−E(X)][yj​−E(Y)]pij​

若 ( X , Y ) (X,Y) (X,Y)是连续型随机变量,其概率密度为 f ( x , y ) f(x,y) f(x,y),则:

C o v ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ [ x − E ( X ) ] [ y − E ( Y ) ] f ( x , y ) d x d y Cov(X,Y)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}[x-E(X)][y-E(Y)]f(x,y)dxdy Cov(X,Y)=∫−∞+∞​∫−∞+∞​[x−E(X)][y−E(Y)]f(x,y)dxdy 另外,方差还可以这样算: C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } = E { X Y − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) } = E ( X Y ) − E ( X ) E ( Y ) − E ( Y ) E ( X ) + E ( X ) E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\}\\=E\{XY-XE(Y)-YE(X)+E(X)E(Y)\}\\=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)\\=E(XY)-E(X)E(Y) Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}=E{XY−XE(Y)−YE(X)+E(X)E(Y)}=E(XY)−E(X)E(Y)−E(Y)E(X)+E(X)E(Y)=E(XY)−E(X)E(Y)

协方差的性质 (1) Cov ⁡ ( X , X ) ≡ D ( X ) \operatorname{Cov}(X, X) \equiv D(X) Cov(X,X)≡D(X) (2) Cov ⁡ ( Y , X ) = Cov ⁡ ( X , Y ) \operatorname{Cov}(Y, X)=\operatorname{Cov}(X, Y) Cov(Y,X)=Cov(X,Y) (3) C C C是一个常数, X X X是一个随机变量,则有 C o v ( X , C ) = 0 Cov(X,C)=0 Cov(X,C)=0 (4) a , b a,b a,b为常数时, Cov ⁡ ( a X , b Y ) = a b Cov ⁡ ( X , Y ) \operatorname{Cov}(a X, b Y)=a b \operatorname{Cov}(X, Y) Cov(aX,bY)=abCov(X,Y)

(5) Cov ⁡ ( X 1 ± X 2 , Y ) = Cov ⁡ ( X 1 , Y ) ± Cov ⁡ ( X 2 , Y ) \operatorname{Cov}\left(X_{1} \pm X_{2}, Y\right)=\operatorname{Cov}\left(X_{1}, Y\right) \pm \operatorname{Cov}\left(X_{2}, Y\right) Cov(X1​±X2​,Y)=Cov(X1​,Y)±Cov(X2​,Y) 一般地,

Cov ⁡ ( ∑ i = 1 m a i X i , ∑ j = 1 n b j Y j ) = ∑ i = 1 m ∑ j = 1 n a i b j Cov ⁡ ( X i , Y j ) . \operatorname{Cov}\left(\sum_{i=1}^{m} a_{i} X_{i}, \sum_{j=1}^{n} b_{j} Y_{j}\right)=\sum_{i=1}^{m} \sum_{j=1}^{n} a_{i} b_{j} \operatorname{Cov}\left(X_{i}, Y_{j}\right) . Cov(i=1∑m​ai​Xi​,j=1∑n​bj​Yj​)=i=1∑m​j=1∑n​ai​bj​Cov(Xi​,Yj​).

(6) D ( X ± Y ) = D ( X ) + D ( Y ) ± 2 Cov ⁡ ( X , Y ) D(X \pm Y)=D(X)+D(Y) \pm 2 \operatorname{Cov}(X, Y) D(X±Y)=D(X)+D(Y)±2Cov(X,Y) 推广到任意有限多个随机变量之和的情形: D ( ∑ i = 1 n X i ) = ∑ i = 1 n D ( X i ) + 2 ∑ 1 ≤ i < j ≤ n C o v ( X i , X j ) D(\sum_{i=1}^{n}X_i)=\sum_{i=1}^{n}D(X_i)+2\sum_{1\le i\lt j\le n}Cov(X_i,X_j) D(i=1∑n​Xi​)=i=1∑n​D(Xi​)+21≤i 0 , D ( Y ) > 0 D(X)\gt0,D(Y)\gt0 D(X)>0,D(Y)>0,则 X , Y X,Y X,Y的相关系数为: ρ X Y = Cov ⁡ ( X , Y ) D ( X ) D ( Y ) \rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}} ρXY​=D(X) ​D(Y) ​Cov(X,Y)​

相关系数的性质: (1) ∣ ρ X Y ∣ ≤ 1 , |\rho_{XY}|\le 1, ∣ρXY​∣≤1,即 ρ X Y ∈ [ − 1 , 1 ] \rho_{XY}\in[-1,1] ρXY​∈[−1,1]

(2) ρ X Y = 0 \rho_{XY}=0 ρXY​=0,称 X X X与 Y Y Y不相关。

(3) X X X与 Y Y Y不相关 ⇔ \Leftrightarrow ⇔ C o v ( X , Y ) = 0 ⇔ D ( X ± Y ) = D ( X ) + D ( Y ) ⇔ E ( X Y ) = E ( X ) E ( Y ) Cov(X,Y)=0\Leftrightarrow D(X \pm Y)=D(X)+D(Y) \Leftrightarrow E(X Y)=E(X) E(Y) Cov(X,Y)=0⇔D(X±Y)=D(X)+D(Y)⇔E(XY)=E(X)E(Y)

(4) X X X和 Y Y Y独立一定有 X X X和 Y Y Y不相关; X X X和 Y Y Y不相关却未必独立。

2.5 矩

k k k阶原点矩

E ( X k ) E(X^k) E(Xk),当 k = 1 k=1 k=1时即为数学期望

k k k阶中心矩

E { [ X − E ( X ) ] k } E\left\{[X-E(X)]^{k}\right\} E{[X−E(X)]k},当 k = 2 k=2 k=2时即为方差,当 k = 1 k=1 k=1时, E [ X − E ( X ) ] = 0 E[X-E(X)]=0 E[X−E(X)]=0

k + l k+l k+l阶混合矩

E ( X k Y l ) , E { [ X − E ( X ) ] k [ Y − E ( Y ) ] l } E\left(X^{k} Y^{l}\right), E\left\{[X-E(X)]^{k}[Y-E(Y)]^{l}\right\} E(XkYl),E{[X−E(X)]k[Y−E(Y)]l}

参考: [1]https://zhuanlan.zhihu.com/p/343367455

[2]概率统计与随机过程 孔告化



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3