洛伦兹变换是如何导出的呢?

您所在的位置:网站首页 复变函数的虚部 洛伦兹变换是如何导出的呢?

洛伦兹变换是如何导出的呢?

2023-04-25 22:20| 来源: 网络整理| 查看: 265

两个惯性坐标系之间的、保证空间坐标原点在 t^{\prime}=t=0 时重合的坐标变换称为洛伦兹变换。本回答将带着读者梳理一番狭义相对论的几何表示(representation)。

摘要首先概述了庞加莱闵可夫斯基试图建立狭义相对论的几何理论的历史,指出闵氏几何是理解狭义相对论的正确方式。从庞加莱的坐标空间出发,分析简单的二维旋转,从几何上直观地推导出boost洛伦兹变换,并自然地引入快度,举例讲述了快度带给我们的便利。最后是讲解双曲函数的数学附录,以及有关四元数的拓展知识。关键词:庞加莱 闵可夫斯基 boost洛伦兹变换 快度 双曲函数作为几何理论的狭义相对论

大多数著作讲狭义相对论时,对狭相几何表示的历史发展脉络少有提及,在我看来是失掉了血肉! 笔者试图梳理一下。

本回答延续了曹则贤老师的著作的一个风格特点,就是强调学问创造者的生卒年份——因而也就确定了学问创造者所处的时代,以及作出发现 (证明) 的时间,这一点非常重要。知识发生时刻之间的关联,会部分反映知识的内在发展逻辑。在历史语境下理解所学到的知识,容易看到知识的自然体系,此应成为学者的习惯。这样写书,我想提请读者,尤其是青少年,早早地关注学问与学问创造者之人格及所处历史情境的关系。有血有肉的历史呐——从庞加莱提出的四维复欧氏空间到闵可夫斯基空间

1905年至1906年间,亨利·庞加莱[1]发现如果将时间作为一个虚坐标 ict (其中 c 为光速, i 是虚数单位)并与三个表示空间的实坐标共同组成四维空间,那么洛伦兹变换就可以看作是这一坐标空间中的坐标旋转,更严格地说,两个相对运动的惯性参照框架(reference frame,常见的翻译是“参考系”译得很糟糕)中时空坐标的洛伦兹变换,可看作是四维复欧氏空间[2]里 (ict,x,y,z) 坐标系(coordinate system)中时空坐标的转动[3]。

但应留心这个坐标系所处的空间,既不是欧几里得空间,也不是闵可夫斯基空间,据说是四维复欧氏空间。将时间作为实坐标的闵可夫斯基空间与将时间作为虚坐标的四维复欧氏空间之间的转换叫作威克转动(wick rotation),庞加莱用的小技巧正是威克转动。它被称作“转动”是因为当我们将复数表示成复平面内一点时,将一复数乘上 i 相当于将复平面内代表此复数的矢量顺时针旋转了 \frac{\pi}{2} 。历史上也有类似的例子,经典的热传导方程就可以通过威克转动与量子力学里的薛定谔方程联系起来。

笔者认为,庞加莱这个想法有投机取巧的味道,很难透过此想法对狭义相对论有更多本质的理解,可能这也是为什么闵可夫斯基提出他的想法,后来成为了理解狭义相对论的正确方式,这是后话。多说一些题外话,有人看到 (ict,x,y,z) 就断言这是复数表示,说时间 t 以复数 it 的身份出现,于是就有了虚时间(time is imaginary)的说法。必须指出,这个认识可能是错的。

我们生活在三维空间中。三维空间矢量,是哈密顿在1843年作为四元数的虚部而引入的表示,即记四元数 q=a+x{\rm I}+y{\rm J}+z{\rm K} ,其中 {\rm I^{2}}={\rm J^{2}}={\rm K^{2}}={\rm I}{\rm J}{\rm K}=-1 ,而四元数的虚部 \vec{r}=x{\rm I}+y{\rm J}+z{\rm K} 是我们在电磁学、电动力学中习惯使用的三维空间矢量表达[4]。对四元数及其如何被麦克斯韦用于电动力学感兴趣的读者可以阅读:愛物理的无双麓叶:电动力学:矢量是四元数的局部(虚部)(读书札记)。如同复数,四元数的模平方为 |q|^{2}=a^{2}+x^{2}+y^{2}+z^{2} 与时空间距的表达不一样[5]。如果令标量 a=ict ,则 q=ict+x{\rm I}+y{\rm J}+z{\rm K} 的模平方与时空间距的表达可以达成一致,但这样得到的四元数的性质就变了。在这种情况下, a,x,y,z 都扩展到了复数域上, q=ict+x{\rm I}+y{\rm J}+z{\rm K} 是双四元数(bi-quaternion)。也就是说,我们在狭义相对论里遇到的时空坐标表示 (ict,x,y,z) ,其中的矢量分量 x,y,z 看似实数是因为它们碰巧取了复数的实部,而 ict 作为这个双四元数的标量,其看似虚数是因为它碰巧取了复数的虚部。一句话,不要想当然地根据时空坐标表示 (ict,x,y,z) 就认定有虚时间。时空坐标是由双四元数表示的。四元数、双四元数在曹则贤老师的《云端脚下:从一元二次方程到规范场论》第八章有详细介绍。

1908年,闵可夫斯基[6]用一种四维时空[7]的观点揭示了理解狭义相对论的正确方式,也是学界现今对时空的普遍认知,click here 查看可视化的相对论。他将虚坐标 ict 替换为实的坐标 ct [8],给出了闵可夫斯基空间的双曲表示。不妨选取

\begin{cases} &x^{0}=c t \\ &x^{1}=x \\ &x^{2}=y \\ &x^{3}=z \end{cases}\tag{A}

作为 4-矢量 x^{\mu} 的分量。前面讲的四维复欧氏空间里没有协变张量和逆变张量之分,但这里不同, (A) 式的选取直接给出不同于四维复欧氏空间的度规(张量):

\mathrm{d} s^{2}=g_{\mu \nu} \mathrm{d} x^{\mu} \mathrm{d} x^{\nu}=\left(\mathrm{d} x^{0}\right)^{2}-\left(\mathrm{d} x^{1}\right)^{2}-\left(\mathrm{d} x^{2}\right)^{2}-\left(\mathrm{d} x^{3}\right)^{2}

因此,闵可夫斯基空间的度规张量为 g_{\mu \nu}=\operatorname{diag}(1,-1,-1,-1) ,即

\begin{equation} g_{\mu\nu}=\begin{pmatrix}   1 & 0 & 0 & 0 \\   0 & -1 & 0 & 0 \\   0 & 0 & -1 & 0 \\   0 & 0 & 0 & -1  \end{pmatrix} \end{equation}

“度规决定几何”,这个度规对应于双曲空间里的几何。

借用四维复欧氏空间推导出洛伦兹变换,并看清快度的来历

尽管闵可夫斯基时空是理解狭义相对论的正确方式,但不代表我们只能用这一种方式推导和计算,实践证明,庞加莱那一套坐标空间(四维复欧氏空间)还是很好用的,不然怎么会被广泛应用于粒子物理[9]。下面我们就用四维复欧氏空间,从几何上直观地推导出洛伦兹变换[10],并最后抵达闵可夫斯基时空。

狭义相对论中,不同惯性参考系之间满足洛伦兹变换。实际上,洛伦兹变换这一结果可以看作是“时空间隔 s 不变的要求”。引入虚数 w=ictw 为长度的量纲[11]。使用四维坐标 (w,x,y,z) 描述的时空间隔:

\begin{equation} {\rm{d}}{s^2} = - {c^2}{\rm{d}}{t^2} + {\rm{d}}{x^2} + {\rm{d}}{y^2} + {\rm{d}}{z^2}= {\rm{d}}{w^2} + {\rm{d}}{x^2} + {\rm{d}}{y^2} + {\rm{d}}{z^2} \end{equation}

ict 代替了 ct ,使得时空度规变为:

\begin{equation} g_{\mu\nu}=\delta_{\mu\nu}=\begin{pmatrix}   1 & 0 & 0 & 0 \\   0 & 1 & 0 & 0 \\   0 & 0 & 1 & 0 \\   0 & 0 & 0 & 1  \end{pmatrix} \end{equation}

因为度规决定空间性质,所以庞加莱四维时空里的几何就是欧氏几何[12]。由于光速不变性,得到四维复欧氏空间的间隔不变性[13]:

\begin{equation} {\rm{d}}{s^2} = {\rm{d}}{w^2} + {\rm{d}}{x^2} + {\rm{d}}{y^2} + {\rm{d}}{z^2}= {\rm{d}}{w^{\prime2}} + {\rm{d}}{x^{\prime2}} + {\rm{d}}{y^{\prime2}} + {\rm{d}}{z^{\prime2}}={\rm{d}}{s^{\prime2}} \end{equation}

满足四维时空间隔不变的变换只有坐标的平移和旋转。平移相当于坐标原点取在别的点,间隔当然不变,很好理解。旋转更是如此,不多说。平移没啥好玩的,不过是换个时间零参考点和坐标零参考点罢了。但是 wx 平面[14]的旋转就好玩了,这样可以从几何上直观地推导出洛伦兹变换。

假定参考系 K^{\prime} 以速度 v 沿 x 轴相对于 K 惯性系运动,这时空间坐标中 y^{\prime}=yz^{\prime}=z ,只有 wx 发生变化,在四维空间 (w,x,y,z) 中表现为 wx 平面内的转动,则推导洛伦兹变换简化为求解 wx 平面内旋转角的问题,如图\ref{庞加莱四维时空的转动}所示,图中 \varphi 为旋转角。

庞加莱四维时空的转动

推导新旧两个坐标系之间的转动矩阵很容易,这里教你一个小技巧。先找一个矢量作为不动的参照——连接 \vec{\mathrm{OP}}x 轴与 \vec{\mathrm{OP}} 的夹角记为 \alpha [15], x^{\prime} 轴与 \vec{\mathrm{OP}} 的夹角记为 \varphi\vec{\mathrm{OP}}x^{\prime} 轴的投影分量为

\begin{align} x^{\prime}&=|\vec{\mathrm{OP}}|\cos{(\alpha-\varphi)}\\ &=|\vec{\mathrm{OP}}|(\cos{\alpha}\cos{\varphi}+\sin{\alpha}\sin{\varphi})\\ &=x\cos{\varphi}+w\sin{\varphi} \end{align}

\vec{\mathrm{OP}}w^{\prime} 轴的投影分量为

\begin{align} w^{\prime}&=|\vec{\mathrm{OP}}|\sin{(\alpha-\varphi)}\\ &=|\vec{\mathrm{OP}}|(\sin{\alpha}\cos{\varphi}+\cos{\alpha}\sin{\varphi})\\ &=w\cos{\varphi}-x\sin{\varphi} \end{align}

则新旧两个坐标系之间的转动变换关系为

\begin{align}   &\begin{cases}\label{新旧坐标之间的几何关系}\tag{1}   x^{\prime}=x\cos{\varphi}+w\sin{\varphi}\\   w^{\prime}=-x\sin{\varphi}+w\cos{\varphi}   \end{cases}\\   &\text{也就是}   \begin{cases}   x^{\prime}=x\cos{\varphi}+ict\sin{\varphi}\\   ict^{\prime}=-x\sin{\varphi}+ict\cos{\varphi}   \end{cases}\\   &\text{也就是}   \begin{cases}\label{转动变换}\tag{2}   x^{\prime}=x\cos{\varphi}+ict\sin{\varphi}\\   ct^{\prime}=xi\sin{\varphi}+ct\cos{\varphi}   \end{cases} \end{align}

这一转动变换不仅满足时空间隔不变[16],而且满足矢量点积形式不变,把式 (1) 代入有:

\begin{equation}   \begin{split} r^{2} =g_{\mu\nu}x^{\mu}x^{\nu}= x^2+w^2 =& x^{\prime2}\cos^{2}{\varphi}-2x^{\prime}w^{\prime}\sin{\varphi}\cos{\varphi}+w^{\prime}\cos^{2}{\varphi}\\ &x^{\prime2}\cos^{2}{\varphi}+2x^{\prime}w^{\prime}\sin{\varphi}\cos{\varphi}+w^{\prime}\cos^{2}{\varphi}\\ =&x^{\prime2}+w^{\prime2} \end{split} \end{equation}

洛伦兹变换下不变的量,常称为洛伦兹标量、不变量,如时空间隔 s 、固有时 \tau=\displaystyle\frac{s}{c}

由于参考系以速度 v 相对运动,则 \varphi 仅与相对速度 v 有关。研究参考系 K^{\prime} 的原点在 K 内的运动,其实就是将 x^{\prime}=0 代入式 (1) ,得:

\begin{equation}   x\cos{\varphi}+w\sin{\varphi}=0\quad\Longrightarrow\quad \tan{\varphi}=-\displaystyle\frac{x}{w}=-\displaystyle\frac{x}{ict}=i\displaystyle\frac{v}{c} \ \text{或}\ \displaystyle\frac{v}{c}=-i\tan{\varphi} \end{equation}

\displaystyle\frac{v}{c} 是实数,那么 \tan{\varphi} 必需是纯虚数, \varphi=iyy 是实数,这里引入的 y 就是所谓的快度)。你肯定会质疑,设 \varphi 是纯虚数, \tan{\varphi} 就一定是纯虚数吗?Shut up and calculate!

利用 -i\tan{(iy)}=\tanh{y} 立即可以得到 \begin{equation}   \displaystyle\frac{v}{c}=-i\tan{\varphi}=-i\tan{(iy)}=\tanh{y} \end{equation} 前面已经假设 y 是实数,那么 \tanh{y} 必然也是实数, QED

利用 \varphi=iy\cos{(iy)}=\cosh{(-y)}=\cosh{(y)}\sin{(iy)}=-i\sinh{(-y)}=i\sinh{(y)} 可以得到

\begin{align}   \cosh{\varphi}&=\cos{(iy)}=\cosh{(y)}\\   \sinh{\varphi}&=\sin{(iy)}=i\sinh{(y)} \end{align}

代入(2)

\begin{equation}\label{洛伦兹变换的双曲函数表示}\tag{3}   \begin{cases}   x^{\prime}=x\cosh{y}-ct\sinh{y}\\   ct^{\prime}=-x\sinh{y}+ct\cosh{y}   \end{cases} \end{equation}

\beta=\displaystyle\frac{v}{c}=\tanh{y}\gamma=\cosh{y} ,利用 \cosh{y}=\displaystyle\frac{1}{\sqrt{1-\tanh^{2}{y}}} ,则 \gamma=\displaystyle\frac{1}{\sqrt{1-\beta^{2}}}\sinh{y}=\cosh{y}\cdot\tanh{y}=\gamma\beta

\begin{cases} \tag{4}   x^{\prime}=\gamma(x-\beta ct)\\ y^{\prime}=y\\ z^{\prime}=z\\ ct^{\prime}=\gamma(ct-\beta x) \end{cases}

这便是洛伦兹变换最常见的形式。注意我已经把虚坐标 ict 换成了实的坐标 ct[17],跟当年闵可夫斯基所做的一样,闵可夫斯基时空的度规为

\begin{equation} g_{\mu\nu}=\begin{pmatrix}   1 & 0 & 0 & 0 \\   0 & -1 & 0 & 0 \\   0 & 0 & -1 & 0 \\   0 & 0 & 0 & -1  \end{pmatrix} \end{equation}

属于双曲空间里的几何。双曲空间里的等距变换(物理的运动)与洛伦兹变换相联系。三维欧几里得空间的等距变换构成欧几里得群,由转动、平移和镜面反射等操作构成。加入了时间维度的闵可夫斯基时空,其等距群为庞加莱群,这是一个10维的非阿贝尔李群。群概念加上几何观点,是深入理解相对论思想及其导出物理的有效工具。狭义相对论作为几何的理论,这是广义相对论的前奏。广义相对论从一开始就是几何的。

双曲空间的几何与欧氏空间的几何截然不同,所以请小心你的“欧氏”几何直觉。

初学相对论者需注意:

看到虚坐标 ict 意味着你的“欧氏”几何的直觉还能用,看到实的坐标 ct 就得小心了,这是另一种几何,在这种几何表示下,才有了类时、类空、光锥等概念。

更多闵氏几何视角下的相对论请读者参考:梁灿彬,曹周键. 从零学相对论[M]. 北京:高等教育出版社,2013.

如果想读更通俗易懂的讲解:闵氏几何是什么?它是如何统一时空并极大简化狭义相对论的?——中科院物理所转载自长尾科技

Lorentz Boost是什么?

1904年,洛伦兹[18]证明了麦克斯韦方程在洛伦兹变换下是协变的(covariant)。

\begin{cases} \tag{i}   x^{\prime}=\gamma(x-\beta ct)\\ y^{\prime}=y\\ z^{\prime}=z\\ ct^{\prime}=\gamma(ct-\beta x) \end{cases}

(i) 式就是人们通常说的与一个方向(这里是 x 方向)的 boost 相对应的洛伦兹变换,这是最简单的 Lorentz boost。

(i) 式中带撇的坐标表示 K^{\prime} 系的时空坐标,不带撇表示 K 系。K 系和 K^{\prime} 系有最简关联,即K^{\prime} 系相对K 系以速度 \bm{v} 沿着 x 轴运动[19]。

读者肯定也猜到了,最一般的 Lorentz boost,指的就是K^{\prime} 系相对K 系以速度 \bm{v} 沿着三维空间中任一方向运动,那么空间坐标中与 \vec{v} 垂直的分量应当在变换下不变,而平行的分量应当与时间混合起来变,具体的洛伦兹变换式为[20]

ct^{\prime}=\gamma(ct-\vec{\beta}\cdot \vec{x}) \ ,\quad \vec{x}^{\prime}=\vec{x}+\displaystyle\frac{\gamma-1}{\beta^{2}}(\vec{\beta}\cdot \vec{x})\vec{\beta}-\gamma\vec{\beta} ct\tag{ii}

这个 boost 实在是很难翻译

有人译作“增速”,可以这样理解,你从(静止)惯性参考系 K 换到另一个相对 K 系有速度 v 的惯性参考系 K^{\prime} ,相当于说整个视角进行了一次提速。有人译作“伪转动”,如本文开头所讲的,洛伦兹变换可以看作是庞加莱那一套四维复欧氏空间中的时空坐标旋转,但又与经典力学里的空间转动不同,故加一“伪”字以区分开。总结就是,转动不改变参考系,伪转动则必然涉及参考系的变化。

我觉得 boost 这个词念起来特别酷,不翻译了,但读者应知道是什么意思。

超好用的快度(rapidity)

由前面的 \beta=\displaystyle\frac{v}{c}=\tanh{y} 不难看出快度是表征运动速度的一个参量。还可以进一步解出快度的表达式: y=\mathrm{artanh}\left(\displaystyle\frac{v}{c}\right)=\displaystyle\frac{1}{2}\log\left(\displaystyle\frac{1+v/c}{1-v/c}\right)

快度的英文名 rapidity 是英国物理学家 Alfred Robb (1873-1936)起的。快度被视作——除了速度以外——描述物体运动快慢的可选方案,对于低速情形,快度和速度接近正比例,但对于高速情形,快度 y 趋于正无穷,而速度 v 趋于光速 c 。用快度 y 表征运动速度的好处是,在相继进行两次洛伦兹变换时,快度简单地相加。以 x 方向的洛伦兹变换为例,如果 K_{1} 相对于 K 有速度 v_{1} (快度 y_{1} ), K_{2} 相对于 K_{1} 有速度 v_{2} (快度 y_{2} ),则 K_{2} 相对于 K 的速度 v\ne v_{1}+v_{2} ,但是相应的快度 y= y_{1}+y_{2}

这可以从前一小节中 \varphi=iy 是“转动角度”直接看出,因为两次转动的总转动角应等于两个转动角之和。从(3) 出发,利用双曲函数的公式也不难证明这一论断。

既然 v\ne v_{1}+v_{2} ,我们想看看正确的速度合成式是什么样子,可以从快度的合成式导出:

\displaystyle\frac{v}{c}=\tanh(y)=\tanh(y_{1}+y_{2})=\displaystyle\frac{\tanh{y_{1}}+\tanh{y_{2}}}{1+\tanh{y_{1}}\tanh{y_{2}}}=\displaystyle\frac{v_{1}/c+v_{2}/c}{1+v_{1}v_{2}/c^{2}}

v=\displaystyle\frac{v_{1}+v_{2}}{1+v_{1}v_{2}/c^{2}} ,这是相对论的速度合成式。

数学附录——双曲函数与三角函数互相表示

双曲函数和三角函数之间的转化关系怎么推导?本节就是要回答这个问题。先看双曲函数具体的定义:

\begin{align}\label{双曲函数定义式} \cosh x&=\frac{e^{x}+e^{-x}}{2}\\ \sinh x&=\frac{e^{x}-e^{-x}}{2} \tag{5} \\ \tanh x&=\frac{e^{x}-e^{-x}}{e^{x}+e^{-x}} \end{align}

三角函数也和指数函数有密切关系,从欧拉公式可以看出。欧拉公式是复变函数里几乎最重要的一个公式,形式上也十分简洁优美:

\begin{equation} e^{i x}=\cos x+i \sin x \end{equation}

-x 替换掉 x ,得到

\begin{equation} e^{-i x}=\cos x-i \sin x \end{equation}

这样我们可以解出正弦和余弦函数与指数函数的关系式:

\begin{equation}\label{正弦和余弦函数与指数函数的关系式} \begin{aligned} &\cos x=\frac{e^{i x}+e^{-i x}}{2}\\ &\sin x=\frac{e^{i x}-e^{-i x}}{2 i} \end{aligned} \end{equation}\tag{6}

再把双曲函数拉过来看看,双曲函数的定义式为

\begin{align} \cosh x&=\frac{e^{x}+e^{-x}}{2}\\ \sinh x&=\frac{e^{x}-e^{-x}}{2} \end{align}

是不是非常接近了呢? 很容易看出它们之间存在这样的关系:

\begin{align}\label{正余弦函数的双曲函数表示}   \cos{x}&=\cosh{(ix)}\\ \sin{x}&=-i\sinh{(ix)}\tag{7}\\ \tan{x}&=-i\tanh{(ix)} \end{align}

由图\ref{双曲函数图像}可以看出, \sinh{\theta},\tanh{\theta} 是奇函数, \cosh{\theta} 是偶函数。

双曲函数图像

利用双曲函数的奇偶性,将 x=iy 代入式( 7 ),立即可以得到

\begin{align}   \cos{(iy)}&=\cosh{(-y)}=\cosh{(y)}\label{cos(iy)}\\ \sin{(iy)}&=-i\sinh{(-y)}=i\sinh{(y)}\label{sin(iy)}\\ \tan{(iy)}&=i\tanh{(y)} \end{align}

从式( 6 )出发也能得到上式,将 x=iy 代入式( 6 ),得

\begin{equation} \begin{aligned} &\cos (iy)=\frac{e^{-y}+e^{y}}{2} \\ &\sin (iy)=\frac{e^{-y}-e^{y}}{2 i} \end{aligned} \end{equation}

对比双曲函数的定义式,很快可以得到:

\begin{equation}\label{双曲函数的正余弦函数表示} \begin{aligned} \cosh{y}&=\cos (iy)\\ \sinh{y}&=-i\sin (iy)\\ \tanh{y}&=-i\tan{(iy)} \end{aligned} \end{equation}

三角函数有 \sin^{2}{x}+\cos^{2}{x}=1 ,双曲函数也有类似的,请读者根据双曲函数的定义式( 5 )验证:

\begin{equation}   \cosh^{2}{y}-\sinh^{2}{y}=1 \end{equation}

\cosh{y} 提出来,再稍微变一变:

\begin{align}   &\cosh^{2}{y}(1-\tanh^{2}{y})=1\\   &\cosh{y}=\displaystyle\frac{1}{\sqrt{1-\tanh^{2}{y}}}\label{cosh的tanh表示} \end{align}

更多双曲函数和反双曲函数的参考可以看这个:click here!

拓展阅读——四元数的威力

想了解四元数在物理学中的威力,可以读一下这个节选:

参考文献:

曹则贤. 云端脚下:从一元二次方程到规范场论[M]. 北京:世界图书出版有限公司北京分公司,2021.7:128, 145-152.曹则贤. 相对论:少年版[M]. 北京:科学出版社,2020.4:113-114.赵亚溥. 力学讲义[M]. 北京:科学出版社,2018.5: 176-177.威克转动(wick rotation)—维基百科



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3