特征值与特征向量在神经网络中的作用: 深度学习的基础

2024-07-17 11:26| 来源: 网络整理| 查看: 265





背景介绍核心概念与联系核心算法原理和具体操作步骤以及数学模型公式详细讲解具体代码实例和详细解释说明未来发展趋势与挑战附录常见问题与解答 2. 核心概念与联系


2.1 特征值



2.2 特征向量




3. 核心算法原理和具体操作步骤以及数学模型公式详细讲解


3.1 计算特征值



$$ y = f(Wx + b) $$

其中,$y$ 是输出层的输出,$f$ 是激活函数,$W$ 是隐藏层的权重矩阵,$x$ 是输入层的输入,$b$ 是隐藏层的偏置向量。


$$ \frac{\partial L}{\partial x} = \frac{\partial L}{\partial y} \cdot \frac{\partial y}{\partial x} $$

其中,$L$ 是损失函数,$\frac{\partial L}{\partial y}$ 是损失函数对于输出层输出的偏导数,$\frac{\partial y}{\partial x}$ 是输入层输入对于输出层输出的偏导数。


3.2 计算特征向量


3.2.1 数据归一化

$$ x_{normalized} = \frac{x - min(x)}{max(x) - min(x)} $$

其中,$x_{normalized}$ 是归一化后的数据,$min(x)$ 和 $max(x)$ 是数据的最小值和最大值。

3.2.2 数据标准化

$$ x_{standardized} = \frac{x - \mu}{\sigma} $$

其中,$x_{standardized}$ 是标准化后的数据,$\mu$ 是数据的均值,$\sigma$ 是数据的标准差。

3.2.3 数据压缩

数据压缩通常涉及到降维技术,如主成分分析(PCA)。PCA 通过计算数据的协方差矩阵,并将其特征值和特征向量进行降维,从而得到新的压缩后的数据。

$$ W{pca} = \frac{1}{\sqrt{\lambdai}}v_i $$

其中,$W{pca}$ 是降维后的权重矩阵,$\lambdai$ 是协方差矩阵的特征值,$v_i$ 是协方差矩阵的特征向量。

3.2.4 数据扩展


4. 具体代码实例和详细解释说明


4.1 计算特征值


```python import numpy as np


x = np.random.rand(100, 10)


W = np.random.rand(10, 1) b = np.random.rand(1)


def sigmoid(z): return 1 / (1 + np.exp(-z))


def loss(ytrue, ypred): return np.mean((ytrue - ypred) ** 2)


def gradient(x, W, b): z = np.dot(x, W) + b y = sigmoid(z) ypred = np.where(y > 0.5, 1, 0) ytrue = np.random.randint(0, 2, size=ypred.shape) lossgradient = 2 * (ytrue - ypred) weightgradient = np.dot(x.T, lossgradient) biasgradient = np.mean(lossgradient) return weightgradient, biasgradient


def update(x, W, b, learningrate): weightgradient, biasgradient = gradient(x, W, b) W -= learningrate * weightgradient b -= learningrate * bias_gradient


for i in range(1000): weightgradient, biasgradient = gradient(x, W, b) update(x, W, b, 0.1)


featurevalues = np.abs(weightgradient) print(feature_values) ```


4.2 计算特征向量


```python import numpy as np


x = np.random.rand(100, 10)


W = np.random.rand(10, 1) b = np.random.rand(1)


def sigmoid(z): return 1 / (1 + np.exp(-z))


def loss(ytrue, ypred): return np.mean((ytrue - ypred) ** 2)


for i in range(1000): z = np.dot(x, W) + b y = sigmoid(z) lossgradient = 2 * (ytrue - ypred) weightgradient = np.dot(x.T, lossgradient) biasgradient = np.mean(lossgradient) W -= learningrate * weightgradient b -= learningrate * bias_gradient


featurevectors = np.dot(x, W) print(featurevectors) ```


5. 未来发展趋势与挑战







6. 附录常见问题与解答













