从一元高斯分布到多元高斯分布（含例子，python代码）

您所在的位置：网站首页 › 多维高斯分布的协方差 › 从一元高斯分布到多元高斯分布（含例子，python代码）

从一元高斯分布到多元高斯分布（含例子，python代码）

2023-08-21 00:36| 来源: 网络整理| 查看: 265

为了简化下面的高斯分布都是按照零均值写的

一元高斯的标准形式： $p(x) = \frac{1}{\sqrt{2\pi}}\exp(-\frac{1}{2}x^2)$

多元高斯的标准形式： $p(\mathbf{x}) = \prod_{i=1}^n\frac{1}{\sqrt{2\pi}}\exp(-\frac{1}{2}x_i^2) = \frac{1}{(2\pi)^{\frac{n}{2}}} \exp(-\frac{1}{2}\mathbf{x^TIx})$

下面推导为什么一般的多元高斯具有形式： $p(\mathbf{x}) = \frac{1}{(2\pi)^{\frac{n}{2}}|\Sigma|^{\frac{1}{2}}}\exp(-\frac{1}{2}\mathbf{x^T\Sigma^{-1}x})$

核心观点：所有的非奇异的多元高斯分布都是以多元标准高斯分布为基础，通过非奇异矩阵 $A$ 进行坐标变换而来的

假设对于一般的多元高斯分布 $p(\mathbf{y})$ 有 $\mathbf{y=Ax, x = A^{-1}y}$

那么

$\begin{align} &p(\mathbf{y}) = p(\mathbf{x})|\frac{dx}{dy}| \\ &= \frac{1}{(2\pi)^{\frac{n}{2}}} \exp\{-\frac{1}{2}\mathbf{(A^{-1}y)^TI(A^{-1}y)}\} |\frac{dx}{dy}|\\ &= \frac{1}{(2\pi)^{\frac{n}{2}}|A|} \exp\{-\frac{1}{2}\mathbf{y^T(AA^T)^{-1}y}\} \end{align}$

$\Sigma_y = \mathbb{E}[yy^T] = A\mathbb{E}[xx^T]A^T= AA^T$

因此 $p(\mathbf{y}) = \frac{1}{(2\pi)^{\frac{n}{2}}|\Sigma|^{\frac{1}{2}}} \exp\{-\frac{1}{2}\mathbf{y^T\Sigma^{-1}y}\}$

这样应该就可以理解公式里面为什么会有协方差矩阵了

代码示例

import numpy as np import matplotlib.pyplot as plt %matplotlib inline

以二维高斯为例

plt.figure(dpi=120) plt.axis([-4,4,-4,4]) plt.gca().set_aspect(1) X = np.random.multivariate_normal(mean=[0,0], cov=[[1, 0], [0,1]], size = 1000) plt.scatter(X[:,0], X[:,1]) ;lt;img src=;https://pic1.zhimg.com/50/v2-73639854084ec72a3d421ebb308b683f_hd.jpg; data-size=;normal; data-rawwidth=;429; data-rawheight=;425; class=;origin_image zh-lightbox-thumb; width=;429; data-original=;https://pic1.zhimg.com/v2-73639854084ec72a3d421ebb308b683f_r.jpg;;gt;

标准分布

数据变换

A = np.array([[1,2],[2,1]]) Y = X.dot(A)

plt.figure(dpi=120) plt.axis([-6,6,-6,6]) plt.gca().set_aspect(1) plt.scatter(Y[:,0], Y[:,1]) ;lt;img src=;https://pic3.zhimg.com/50/v2-83d2ceb4e37bcc41f8ae86b746f15a1c_hd.jpg; data-size=;normal; data-rawwidth=;428; data-rawheight=;425; class=;origin_image zh-lightbox-thumb; width=;428; data-original=;https://pic3.zhimg.com/v2-83d2ceb4e37bcc41f8ae86b746f15a1c_r.jpg;;gt;

变化后分布

验证

print(Y.transpose().dot(Y) / 1000) # array([[ 4.84023848, 3.92638569], # [ 3.92638569, 5.01025796]]) print(A.dot(A.transpose())) # array([[5, 4], # [4, 5]])

可以看出转化后的数据Y的协方差 $\Sigma = AA^T$