什么叫正交变换?为什么要正交变换?

您所在的位置:网站首页 正交矩阵特征值为实数 什么叫正交变换?为什么要正交变换?

什么叫正交变换?为什么要正交变换?

2024-05-09 04:20| 来源: 网络整理| 查看: 265

特征值、特征向量与变换是高等代数的灵魂,而正交变换是唯一没有发生形变的变换,由旋转和反射构成。是本篇文章专门讨论正交变换与正交矩阵的特征值、特征向量与准对角化。当然正交矩阵只是一类特殊的矩阵,我们在文章

特征值是高等代数的灵魂!是宝藏!

中已经对矩阵按照特征值与特征向量的结构以及实、复等因素给矩阵作了分类并详细讨论,而本篇文章专门讨论正交矩阵。

幺正矩阵及正交矩阵的定义正交矩阵的性质正交变换的定义正交变换与正交矩阵的关系正交变换的特征值的绝对值为 1 幺正矩阵与正交矩阵必有特征值与特征向量幺正变换(矩阵)及正交矩阵不同特征值的特征向量(复特征值与复特征向量也包含在内)相互正交正交矩阵可以准对角化为特征值 \pm 1 以及二维的旋转块(过渡矩阵可以是正交矩阵),且这些特征向量与二维子空间两两之间相互正交1. 幺正矩阵及正交矩阵的定义

若复数矩阵 A 满足

A^{H}A=I

则称 A 为幺正矩阵,其中上标 H 表示转置复共轭, I 表示单位矩阵。特别地,若实数矩阵 A 满足

A^{T}A=I

则称 A 为幺正矩阵,其中上标 T 表示转置。显然正交矩阵是特殊的幺正矩阵。

2. 幺正矩阵与正交矩阵的性质

A^{H}A=I\Longleftrightarrow A^{H}AA^{H}=A^{H}\Longleftrightarrow AA^{H}=I

也就是说,幺正矩阵的不同的行(列)向量在标准正交归一基底下是正交的,即不同行(列)之间内积为零;相同的行在标准正交归一基底下内积为 1 .

3. 幺正变换与正交变换的定义

对于复数域上的线性空间 V 上的任意向量 \bm{\alpha}, \bm{\beta} , 若变换 \mathcal{A} 保证向量内积不变,即

(\mathcal{A}\bm{\alpha}, \mathcal{A}\bm{\beta})=(\bm{\alpha}, \bm{\beta})

则称 \mathcal{A} 为幺正变换。特别地,对于实数域上的线性空间 V 上的任意向量 \bm{\alpha}, \bm{\beta} , 若变换 \mathcal{A} 保证向量内积不变,即

(\mathcal{A}\bm{\alpha}, \mathcal{A}\bm{\beta})=(\bm{\alpha}, \bm{\beta})

则称 \mathcal{A} 为正交变换。

4. 幺正变换与幺正矩阵的关系及正交变换与正交矩阵的关系

假定 \mathcal{A} 是线性空间 V 上的幺正变换,对于任意的向量 \bm{\alpha}\in V , 设其在标准正交基下的坐标为 X , 则

(\mathcal{A}\bm{\alpha}, \mathcal{A}\bm{\alpha})=(\bm{\alpha}, \bm{\alpha})\Longleftrightarrow(AX, AX)=(X, X)\Longleftrightarrow X^{H}A^{H}AX=X^{H}X\Longleftrightarrow A^{H}A=I

即,在标准正交基下,变换是幺正变换的充分必要条件是它对应的矩阵是幺正矩阵。因此我们只需要研究幺正矩阵的性质便可知道幺正变换的一切性质。特别地,假定 \mathcal{A} 是线性空间 V 上的正交变换,对于任意的向量 \bm{\alpha}\in V , 设其在标准正交基下的坐标为 X , 则

(\mathcal{A}\bm{\alpha}, \mathcal{A}\bm{\alpha})=(\bm{\alpha}, \bm{\alpha})\Longleftrightarrow(AX, AX)=(X, X)\Longleftrightarrow X^{T}A^{T}AX=X^{T}X\Longleftrightarrow A^{T}A=I

即,在标准正交基下,变换是正交变换的充分必要条件是它对应的矩阵是正交矩阵。因此我们只需要研究正交矩阵的性质便可知道正交变换的一切性质下文我们默认在标准正交基下讨论问题

5. 幺正变换(矩阵)与正交变换(矩阵)的特征值的绝对值为 1

假定 \lambda 是幺正变换 \mathcal{A} 的一个特征值, \bm{\alpha} 是其对应的特征向量(当然这个特征向量的坐标可能不是实数,如果非要限制在实数范围内可能该特征值没有特征向量),则有

(\mathcal{A}\bm{\alpha}, \mathcal{A}\bm{\alpha})=(\bar{\lambda}\bm{\alpha}, \lambda\bm{\alpha})=|\lambda|^{2}(\bm{\alpha}, \bm{\alpha})=(\bm{\alpha}, \bm{\alpha})\Longleftrightarrow |\lambda|=1

因此,幺正变换的特征值的绝对值必然为 1 . 特别地,幺正变换的实特征值必为 \pm 1 . 而幺正矩阵是幺正变换在标准正交基矢下对应的矩阵,因此它的特征值的绝对值必然为 1 . 特别地,幺正变换的实特征值必为 \pm 1 . 特别地,这些结论对于正交矩阵显然也成立。

6. 幺正矩阵与正交矩阵必有特征值与特征向量

根据代数学基本定理,特征方程必然有根,因此必然存在特征值,一个特征值至少对应一个特征向量,所以必然有特征值和特征向量。代数学基本定理的证明可参考文章

代数学基本定理的简单证明方法(无需学过复变函数论或拓扑学)

其中的方法是本人自悟的方法,即使高中生也能看懂,不需要复变函数论的知识。

7. 幺正变换(矩阵)及正交矩阵不同特征值的特征向量(复特征值与复特征向量也包含在内)相互正交

假定线性空间 V 上的幺正变换 \mathcal{A} , 标准正交基下对应的矩阵为 A , 假定 \bm{\alpha}, \bm{\beta} 分别是特征值为 \lambda_{1}, \lambda_{2} 的特征向量且 \lambda_{1}\neq\lambda_{2} ,则

(\mathcal{A}\bm{\alpha}, \mathcal{A}\bm{\beta})=(\bm{\alpha}, \bm{\beta})\Longleftrightarrow(\lambda_{1}\bm{\alpha}, \lambda_{2}\bm{\beta})=(\bm{\alpha}, \bm{\beta})\Longleftrightarrow\bar{\lambda}_{1}\lambda_{2}(\bm{\alpha}, \bm{\beta})=(\bm{\alpha}, \bm{\beta})\Longleftrightarrow(\bm{\alpha}, \bm{\beta})=0

因此幺正变换属于不同特征值的特征向量是正交的,幺正矩阵属于不同的特征值的特征向量在标准正交基矢下是正交的特别地,这个结论对于正交矩阵显然成立。

8. n 阶幺正矩阵必有 n个线性无关的特征向量,因此幺正矩阵一定能够被对角化(过渡矩阵可以是幺正矩阵)

对于任意的幺正变换 \mathcal{A} 在标准正交基矢下对应的幺正矩阵 A , 我们一定可以通过选取一组正交归一基矢 \bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{n} ,使得在新的基矢下的 \mathcal{A} 的矩阵被对角化为

A' = \left( \begin{array}{ccc}  \lambda_{1} & 0 & \cdots & 0 \\  0 & \lambda_{2} & \cdots & 0 \\  \vdots & \vdots & & \vdots \\  0 & 0 & \cdots & \lambda_{n} \end{array} \right)

由代数学基本定理,一定存在特征值 \lambda_{1} , 不妨假定这个特征向量为 \bm{\alpha} , 将与 \bm{\alpha} 垂直的子空间记作 \bm{\alpha}^{\bot} , 则对于任意的向量 \bm{\beta}\in\bm{\alpha}^{\bot} , 有

(\bm{\alpha}, \mathcal{A}\bm{\beta})=\frac{1}{\bar{\lambda}_{1}}(\lambda_{1}\bm{\alpha}, \mathcal{A}\bm{\beta})=\frac{1}{\bar{\lambda}_{1}}(\mathcal{A}\bm{\alpha}, \mathcal{A}\bm{\beta})=\frac{1}{\bar{\lambda}_{1}}(\bm{\alpha}, \bm{\beta})=0

这说明 \bm{\alpha}^{\bot} 是反对称变换 \mathcal{A} 的不变子空间。根据数学归纳法,可知在 n-1 维子空间 \bm{\alpha}^{\bot} 上经过适当地选取正交归一的基矢 \bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{n-1} , 则 \mathcal{A} 在子空间 \bm{\alpha}^{\bot} 上的变换可表示为 (n-1)\times(n-1) 阶矩阵

\left( \begin{array}{ccc}  \lambda_{2} & 0 & \cdots & 0 \\  0 & \lambda_{3} & \cdots & 0 \\  \vdots & \vdots & & \vdots \\  0 & 0 & \cdots & \lambda_{n} \end{array} \right)

则我们选取正交归一的向量组

\frac{\bm{\alpha}}{|\bm{\alpha}|}, \bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{n-1},

作为新基矢,变换 \mathcal{A} 对应的矩阵被对角化为我们要证明的形式,即

 A'=S^{-1}AS ,

其中 S 是由

\frac{\bm{\alpha}}{|\bm{\alpha}|}, \bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{n-1}

作为列向量组成的幺正矩阵。

9. 正交矩阵可以准对角化为特征值 \pm 1 以及二维的旋转块(过渡矩阵可以是正交矩阵),且这些特征向量与二维子空间两两之间相互正交

对于任意的正交变换 \mathcal{A} 在标准正交基矢下对应的正交矩阵 A , 我们一定可以通过选取一组正交归一基矢 \bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{n} ,使得在新的基矢下的 \mathcal{A} 的矩阵被准对角化为

A' = \left( \begin{array}{ccc} R_{1} & O & \cdots & O & O & O \\ O & R_{2} & \cdots & O & O & O \\ \vdots & \vdots & & \vdots & \vdots & \vdots\\ O & O & \cdots & R_{s} & O & O \\ O & O & \cdots & O & -I_{l} & O \\ O & O & \cdots & O & O & I_{m} \end{array} \right)

其中 O 是零矩阵,

R_{i}= \left( \begin{array}{c} \cos\theta_{i} & -\sin\theta_{i} \\ \sin\theta_{i} & \cos\theta_{i} \end{array} \right)

即存在正交矩阵 S

A'=S^{-1}AS

其中 S 是由 \bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{n} 的坐标作为列向量排列成的正交矩阵。

这个问题我们可以使用数学归纳法来证明,即假定这个结论对于不大于 n-1 维正交矩阵已经成立,由此证明在 n 维矩阵上也成立。假定 n 维正交矩阵 A (正交变换 \mathcal{A} )的一个特征值为 \lambda , 则我们分两种情况讨论:

1. \lambda 为实数

当特征值为实数时,显然它的特征向量也是实数。不妨假定这个特征向量为 \bm{\alpha} , 将与 \bm{\alpha} 垂直的子空间记作 \bm{\alpha}^{\bot} , 则对于任意的向量 \bm{\beta}\in\bm{\alpha}^{\bot} , 有

(\lambda\bm{\alpha}, \mathcal{A}\bm{\beta})=(\mathcal{A}\bm{\alpha}, \mathcal{A}\bm{\beta})=(\bm{\alpha}, \bm{\beta})=0\Longleftrightarrow\bm{\alpha}\bot\mathcal{A}\bm{\beta}

这说明 \bm{\alpha}^{\bot} 是正交变换 \mathcal{A} 的不变子空间。根据数学归纳法,可知在 n-1 维子空间 \bm{\alpha}^{\bot} 上经过适当地选取正交归一的基矢 \bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{n-1} , 则 \mathcal{A} 在子空间 \bm{\alpha}^{\bot} 上的变换可表示为 (n-1)\times(n-1) 阶矩阵

\left( \begin{array}{ccc} R_{1} & O & \cdots & O & O & O \\ O & R_{2} & \cdots & O & O & O \\ \vdots & \vdots & & \vdots & \vdots & \vdots\\ O & O & \cdots & R_{s} & O & O \\ O & O & \cdots & O & -I_{l-1} & O \\ O & O & \cdots & O & O & I_{m} \end{array} \right)

\left( \begin{array}{ccc} R_{1} & O & \cdots & O & O & O \\ O & R_{2} & \cdots & O & O & O \\ \vdots & \vdots & & \vdots & \vdots & \vdots\\ O & O & \cdots & R_{s} & O & O \\ O & O & \cdots & O & -I_{l} & O \\ O & O & \cdots & O & O & I_{m-1} \end{array} \right)

其中 O 是零矩阵,

R_{i}= \left( \begin{array}{c} \cos\theta_{i} & -\sin\theta_{i} \\ \sin\theta_{i} & \cos\theta_{i} \end{array} \right)

则我们选取正交归一的向量组

\bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{2s+l-1}, \frac{\bm{\alpha}}{|\bm{\alpha}|}, \bm{\varepsilon}_{2s+l}, \bm{\varepsilon}_{2s+l+1}, \cdots, \bm{\varepsilon}_{n-1}

\bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{n-1}, \frac{\bm{\alpha}}{|\bm{\alpha}|}

作为新基矢,变换 \mathcal{A} 对应的矩阵被准对角化为我们要证明的形式,即

 A'=S^{-1}AS ,

其中 S 是由

\bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{2s+l-1}, \frac{\bm{\alpha}}{|\bm{\alpha}|}, \bm{\varepsilon}_{2s+l}, \bm{\varepsilon}_{2s+l+1}, \cdots, \bm{\varepsilon}_{n-1}

\bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{n-1}, \frac{\bm{\alpha}}{|\bm{\alpha}|}

作为列向量组成的正交矩阵。

2. \lambda 为复数

\lambda 为非实数时,由于特征方程是实系数,因此它的复共轭 \bar{\lambda} 也是特征方程的一个根,参见

为什么实系数多项式方程的虚数解总是成对出现?

\bar{\lambda} 也是一个特征值。假定 \lambda 特征向量 \bm{\alpha} 的坐标为 X+\mathbb{i}Y , 则显然

A(X+\mathbb{i}Y)=\lambda(X+\mathbb{i}Y)\Longleftrightarrow A(X-\mathbb{i}Y)=\bar{\lambda}(X-\mathbb{i}Y)

X-\mathbb{i}Y\bar{\lambda} 的特征向量。我们已经证明属于不同特征值的特征向量正交,因此

(X-\mathbb{i}Y, X+\mathbb{i}Y)=0\Longleftrightarrow(X, X)-(Y, Y)+2\mathbb{i}(X, Y)=0\Longleftrightarrow \left\{ \begin{array}{c} (X, X)=(Y, Y)\\ (X, Y)=0 \end{array} \right.

也就是说, XY 模长相等并且在标准正交基下相互正交。我们已经证明特征值的绝对值必然为 1 , 因此可设

\lambda=\mathbb{e}^{-\mathbb{i}\theta}

A(X+\mathbb{i}Y)=\mathbb{e}^{-\mathbb{i}\theta}(X+\mathbb{i}Y)=X\cos\theta+Y\sin\theta+\mathbb{i}(-X\sin\theta+Y\cos\theta)\Longleftrightarrow \left\{ \begin{array}{c} AX=X\cos\theta+Y\sin\theta\\ AY=-X\sin\theta+Y\cos\theta \end{array} \right.

因此有

\mathcal{A}(X, Y)=(X, Y) \left( \begin{array}{cc} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{array} \right)

因此 X, Y 生成的子空间 L(X, Y) 是一个不变子空间,记与 L(X, Y) 垂直的子空间为 W , 对于任意的 \bm{\alpha}\in L(X, Y), \bm{\beta}\in W ,

(\bm{\alpha}, \bm{\beta})=0\Longleftrightarrow(\mathcal{A}\bm{\alpha}, \mathcal{A}\bm{\beta})=0\Longrightarrow\mathcal{A}\bm{\beta}\in W

W 也是不变子空间,根据归纳假设,在 n-2 维不变子空间 W 上,我们选取一组正交归一向量组 \bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{n-2} 作为新的基矢,则 \mathcal{A} 在子空间 W 上的变换对应的矩阵可表示为 (n-2)\times(n-2) 维矩阵

\left( \begin{array}{ccc} R_{1} & O & \cdots & O & O & O \\ O & R_{2} & \cdots & O & O & O \\ \vdots & \vdots & & \vdots & \vdots & \vdots\\ O & O & \cdots & R_{s-1} & O & O \\ O & O & \cdots & O & -I_{l} & O \\ O & O & \cdots & O & O & I_{m} \end{array} \right)

则我们选取正交归一的向量组

\bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{2s-2}, \frac{X}{|X|}, \frac{Y}{|Y|}, \bm{\varepsilon}_{2s-1}, \bm{\varepsilon}_{2s}, \cdots, \bm{\varepsilon}_{n-2}

作为新基矢,变换 \mathcal{A} 对应的矩阵被准对角化为我们要证明的形式,即

 A'=S^{-1}AS ,

其中 S 是由

\bm{\varepsilon}_{1}, \bm{\varepsilon}_{2}, \cdots, \bm{\varepsilon}_{2s-2}, \frac{X}{|X|}, \frac{Y}{|Y|}, \bm{\varepsilon}_{2s-1}, \bm{\varepsilon}_{2s}, \cdots, \bm{\varepsilon}_{n-2}

作为列向量组成的正交矩阵。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3