三维幺模正交群SO(3)

O(3)\text{O}(3): 三维实正交群,所有的 3×33 \times 3 正交矩阵 RRdetR=±1\det R = \pm 1

O(3)=SO(3)Ci=SO(3)i SO(3)\text{O}(3) = \text{SO}(3) \otimes C_i = \text{SO}(3) \oplus i \text{ SO}(3)

SO(3)\text{SO}(3): 三维幺模实正交群,O(3)\text{O}(3) 的子群: detR=1\det R = 1 的分支,也称“正当转动群”,“完全转动群”

RRT=RTR=I,detR=1,x=RxR R^T = R^T R = I, \quad \det R = 1, \quad \boldsymbol{x}' = R \boldsymbol{x}

x12+x22+x32=x12+x22+x32x'^2_1 + x'^2_2 + x'^2_3 = x^2_1 + x^2_2 + x^2_3

SO(3)\text{SO}(3) 为三参数李群,可有不同参数化形式:

  1. 由无穷小生成元生成,对应参数 α1,α2,α3\alpha_1, \alpha_2, \alpha_3

  2. n\boldsymbol{n} 方向转轴转动 ω\omega 角度,对应参数 n(θ,ϕ),ω\boldsymbol{n}(\theta,\phi), \omega

  3. 先后绕 x,y,zx, y, z 轴转一定角度,对应参数 α1,α2,α3\alpha_1, \alpha_2, \alpha_3

  4. 欧拉角,对应参数 α,β,γ\alpha, \beta, \gamma

无穷小生成元

由无穷小生成元生成,对应参数 α1,α2,α3\alpha_1, \alpha_2, \alpha_3

可以得到 SO(3)\text{SO}(3) 的三个无穷小生成元:

X1=(000001010),X2=(001000100),X3=(010100000)X_1= \begin{pmatrix} 0 & 0 & 0 \\[0.5em] 0 & 0 & -1 \\[0.5em] 0 & 1 & 0 \end{pmatrix},\qquad X_2= \begin{pmatrix} 0 & 0 & 1 \\[0.5em] 0 & 0 & 0 \\[0.5em] -1 & 0 & 0 \end{pmatrix},\qquad X_3= \begin{pmatrix} 0 & -1 & 0 \\[0.5em] 1 & 0 & 0 \\[0.5em] 0 & 0 & 0 \end{pmatrix}

将无穷小生成元 ee 指数化,可生成有限群元 Rx(α1),Ry(α2),Rz(α3)R_x(\alpha_1),R_y(\alpha_2),R_z(\alpha_3)

exp(α1X1)=(1000cosα1sinα10sinα1cosα1),exp(α2X2)=(cosα20sinα2010sinα20cosα2),exp(α3X3)=(cosα3sinα30sinα3cosα30001)\exp(\alpha_1X_1)= \begin{pmatrix} 1 & 0 & 0 \\[0.5em] 0 & \cos\alpha_1 & -\sin\alpha_1 \\[0.5em] 0 & \sin\alpha_1 & \cos\alpha_1 \end{pmatrix},\quad\exp(\alpha_2X_2)= \begin{pmatrix} \cos\alpha_2 & 0 & \sin\alpha_2 \\[0.5em] 0 & 1 & 0 \\[0.5em] -\sin\alpha_2 & 0 & \cos\alpha_2 \end{pmatrix},\quad \exp(\alpha_3X_3)= \begin{pmatrix} \cos\alpha_3 & -\sin\alpha_3 & 0 \\[0.5em] \sin\alpha_3 & \cos\alpha_3 & 0 \\[0.5em] 0 & 0 & 1 \end{pmatrix}

可见,X1,X2,X3X_1,X_2,X_3 分别对应绕 x,y,zx,y,z 轴转 α1,α2,α3\alpha_1,\alpha_2,\alpha_3 角度的转动。将这三个参数按无穷小生成元的方式构造任意一个群元

g(α1,α2,α3)=exp(α1X1+α2X2+α3X3)=exp[(0α3α2α30α1α2α10)]g(\alpha_1,\alpha_2,\alpha_3)=\exp(\alpha_1X_1+\alpha_2X_2+\alpha_3X_3)=\exp\left[ \begin{pmatrix} 0 & -\alpha_3 & \alpha_2 \\[0.5em] \alpha_3 & 0 & -\alpha_1 \\[0.5em] -\alpha_2 & \alpha_1 & 0 \end{pmatrix}\right]

原则上,当一个矩阵作为指数幂时,需要进行泰勒展开,展开后的结果为

=1α2(α12+cos(α)(α22+α32)cos(α)α1α2+α1α2αsin(α)α3αsin(α)α2cos(α)α1α3+α1α3cos(α)α1α2+α1α2+αsin(α)α3α22+cos(α)(α12+α32)αsin(α)α1cos(α)α2α3+α2α3αsin(α)α2cos(α)α1α3+α1α3αsin(α)α1cos(α)α2α3+α2α3α32+cos(α)(α12+α22))=\frac{1}{\alpha^{2}} \begin{pmatrix} \alpha_{1}^{2}+\cos(\alpha)\left(\alpha_{2}^{2}+\alpha_{3}^{2}\right) & -\cos(\alpha)\alpha_{1}\alpha_{2}+\alpha_{1}\alpha_{2}-\alpha\sin(\alpha)\alpha_{3} & \alpha\sin(\alpha)\alpha_{2}-\cos(\alpha)\alpha_{1}\alpha_{3}+\alpha_{1}\alpha_{3} \\[0.5em] -\cos(\alpha)\alpha_{1}\alpha_{2}+\alpha_{1}\alpha_{2}+\alpha\sin(\alpha)\alpha_{3} & \alpha_{2}^{2}+\cos(\alpha)\left(\alpha_{1}^{2}+\alpha_{3}^{2}\right) & -\alpha\sin(\alpha)\alpha_{1}-\cos(\alpha)\alpha_{2}\alpha_{3}+\alpha_{2}\alpha_{3} \\[0.5em] -\alpha\sin(\alpha)\alpha_{2}-\cos(\alpha)\alpha_{1}\alpha_{3}+\alpha_{1}\alpha_{3} & \alpha\sin(\alpha)\alpha_{1}-\cos(\alpha)\alpha_{2}\alpha_{3}+\alpha_{2}\alpha_{3} & \alpha_{3}^{2}+\cos(\alpha)\left(\alpha_{1}^{2}+\alpha_{2}^{2}\right) \end{pmatrix}

其中 α=α12+α22+α32\alpha=\sqrt{\alpha_1^2+\alpha_2^2+\alpha_3^2}

绕轴转动

n\boldsymbol{n} 方向转轴转动 ω\omega 角度,对应参数 n(θ,ϕ),ω\boldsymbol{n}(\theta,\phi), \omega

n=(n1,n2,n3)\boldsymbol{n}=\left(n_1,n_2,n_3\right) 为转轴方向的单位矢量,且 n12+n22+n32=1n_1^2+n_2^2+n_3^2=1ω\omega 为绕转轴 n\boldsymbol{n} 转动的角度。为方便起见,我们将转轴方向用球坐标表示:

n=(n1,n2,n3)=(sinθcosϕ,sinθsinϕ,cosθ)\boldsymbol{n}=(n_1,n_2,n_3)=(\sin\theta\cos\phi,\sin\theta\sin\phi,\cos\theta)

要想描述绕 n\boldsymbol{n} 方向转轴转动 ω\omega 角度的转动 R(n,ω)R(\boldsymbol{n},\omega),可以将转轴转至 zz 轴方向,绕 zz 轴转动 ω\omega 角度,再将 zz 轴转回原来位置。若定义 S=S(θ,ϕ)S=S(\theta,\phi)(0,0,1)(0,0,1) 方向转到 n\boldsymbol{n} 方向,则有

R(n,ω)=SRz(ω)S1R(n,\omega)=SR_z(\omega)S^{-1}

SS 是不唯一的,我们找到一个合适的 SS 即可:

S=Rz(ϕ)Ry(θ)=(cosθcosϕsinϕsinθcosϕcosθsinϕcosϕsinθsinϕsinθ0cosθ)S(001)=(n1n2n3)S=R_z(\phi)R_y(\theta)= \begin{pmatrix} \cos\theta\cos\phi & -\sin\phi & \textcolor{blue}{\sin\theta\cos\phi} \\[0.5em] \cos\theta\sin\phi & \cos\phi & \textcolor{blue}{\sin\theta\sin\phi} \\[0.5em] -\sin\theta & 0 & \textcolor{blue}{\cos\theta} \end{pmatrix}\quad \Rightarrow \quad S \begin{pmatrix} 0 \\[0.5em] 0 \\[0.5em] 1 \end{pmatrix}= \begin{pmatrix} \textcolor{blue}{n_1} \\[0.5em] \textcolor{blue}{n_2} \\[0.5em] \textcolor{blue}{n_3} \end{pmatrix}

只要 SS3×33\times 3 正交矩阵且最后一列蓝色部分相同,即可满足要求。

先计算 zz 方向的无穷小生成元的变换为

SX3S1=(0cosθsinθsinϕcosθ0sinθcosϕsinθsinϕsinθcosϕ0)=(0n3n2n30n1n2n10)=n1X1+n2X2+n3X3=nX\begin{aligned} SX_3S^{-1} & = \begin{pmatrix} 0 & -\cos\theta & \sin\theta\sin\phi \\[0.5em] \cos\theta & 0 & -\sin\theta\cos\phi \\[0.5em] -\sin\theta\sin\phi & \sin\theta\cos\phi & 0 \end{pmatrix}= \begin{pmatrix} 0 & -n_3 & n_2 \\[0.5em] n_3 & 0 & -n_1 \\[0.5em] -n_2 & n_1 & 0 \end{pmatrix} \\[2em] &=n_1X_1+n_2X_2+n_3X_3=\boldsymbol{n}\cdot \boldsymbol{X} \end{aligned}

再计算绕 R(n,ω)R\left(\boldsymbol{n},\omega\right) 的转动矩阵:

R(n,ω)=SRz(ω)S1=Sexp(ωX3)S1=exp(SωX3S1)=exp(ωnX)=exp(ωn1X1+ωn2X2+ωn3X3)=g(ωn1,ωn2,ωn3)=g(ωn)\begin{aligned} R(\boldsymbol{n},\omega) & =SR_z(\omega)S^{-1}=S\exp(\omega X_3)S^{-1}=\exp(S\omega X_3S^{-1}) \\[1em] & =\exp(\omega\boldsymbol{n}\cdot\boldsymbol{X})=\exp(\omega n_1X_1+\omega n_2X_2+\omega n_3X_3) \\[1em] & =g(\omega n_1,\omega n_2,\omega n_3)=g(\omega \boldsymbol{n}) \end{aligned}

即,绕任意转轴 n\boldsymbol{n} 转动 ω\omega 的参数化为

R(n,ω)=exp(ωnX)=g(ωn)\boxed{R(n,\omega)=\exp(\omega n\cdot X)=g(\omega n)}

这就和第(1)种无穷小生成元的参数化方式是一致的,只是参数从 αωn\vec{\alpha}\rightarrow \omega \vec{n},可见(1)中由无穷小生成元指数化的参数化方式就是绕某个轴的转动,(1)参数化形式可写为

g(α)=g(α1,α2,α3)=exp(αX)=exp(αααX)=g(ααα)=R(αα,α)g(\boldsymbol{\alpha})=g(\alpha_1,\alpha_2,\alpha_3)=\exp(\boldsymbol{\alpha}\cdot \boldsymbol{X})=\exp(\alpha \frac{\boldsymbol{\alpha}}{\alpha}\cdot \boldsymbol{X})=g(\alpha \frac{\boldsymbol{\alpha}}{\alpha})=R\left(\frac{\boldsymbol{\alpha}}{\alpha},\alpha\right)

转轴为 n=αα=1α(α1,α2,α3)\boldsymbol{n}=\dfrac{\boldsymbol{\alpha}}{\alpha}=\dfrac{1}{\alpha}(\alpha_1,\alpha_2,\alpha_3),转角为 ω=α=a12+α22+α32\omega=\alpha=\sqrt{a_1^2+\alpha_2^2+\alpha_3^2}。把 n,ω\boldsymbol{n},\omega 代入 g(α)g(\boldsymbol{\alpha}) 的矩阵表达式,即可得到绕任意转轴转动的矩阵形式 R(n,ω)=R(\boldsymbol{n},\omega)=

(n12+(n22+n32)cosωn1n2(1cosω)n3sinωn1n3(1cosω)+n2sinωn1n2(1cosω)+n3sinωn22+(n12+n32)cosωn2n3(1cosω)sin(ω)n1n1n3(1cosω)n2sinωn2n3(1cosω)+n1sinωn32+(n12+n22)cosω)\begin{pmatrix} n_1^2+\left(n_2^2+n_3^2\right)\cos\omega & n_1n_2(1-\cos\omega)-n_3\sin\omega & n_1n_3(1-\cos\omega)+n_2\sin\omega \\[1em] n_1n_2(1-\cos\omega)+n_3\sin\omega & n_2^2+\left(n_1^2+n_3^2\right)\cos\omega & n_2n_3(1-\cos\omega)-\sin(\omega)n_1 \\[1em] n_1n_3(1-\cos\omega)-n_2\sin\omega & n_2n_3(1-\cos\omega)+n_1\sin\omega & n_3^2+\left(n_1^2+n_2^2\right)\cos\omega \end{pmatrix}

绕任意转轴 n\boldsymbol{n} 转动 ω\omega 角度的形式具有性质

R(n,ω)R(n,2πω)\begin{aligned} & R(n,\omega)\equiv R(-n,2\pi-\omega) \end{aligned}

这说明绕相反方向转动 2πω2\pi-\omega 角度,和绕正方向转动 ω\omega 角度是等价的,这也就限定了参数的取值范围

n(θ,ϕ){0θπ0ϕ2π,0ωπ\begin{aligned} & \boldsymbol{n}(\theta,\phi) \begin{cases} 0\leq\theta\leq\pi \\ 0\leq\phi\leq2\pi & & \end{cases},\qquad 0\leq\omega\leq\pi \end{aligned}

可将参数取为半径为 π\pi 的球体内的所有点的球坐标(ω,θ,ϕ)(\omega,\theta,\phi),如下图所示:

SO(3)群转动空间

球内部的每一个点对应一个群元,根据 R(n,π)R(n,π)R(n,\pi)\equiv R(-n,\pi),球面上任意直径两端的点虽然在参数空间内是不同的两点,但对应同一个群元。若在参数空间内任取两个点 P,QP,Q,任意连接 P,QP,Q 的连续变化曲线 PQPQ,无法通过连续变化和 PB1B2QPB_1B_2Q 重合(B1,B2B_1,B_2 代表同一个群元,在群元上是连续的),分成了两组曲线,说明 SO(3)\text{SO}(3) 群是双连通的。

三个方向直接转动

(3)先后绕 x,y,zx, y, z 轴转一定角度,对应参数 α1,α2,α3\alpha_1, \alpha_2, \alpha_3

exp(α1X1)=(1000cosα1sinα10sinα1cosα1),exp(α2X2)=(cosα20sinα2010sinα20cosα2),exp(α3X3)=(cosα3sinα30sinα3cosα30001)\exp(\alpha_1X_1)= \begin{pmatrix} 1 & 0 & 0 \\[0.5em] 0 & \cos\alpha_1 & -\sin\alpha_1 \\[0.5em] 0 & \sin\alpha_1 & \cos\alpha_1 \end{pmatrix},\quad\exp(\alpha_2X_2)= \begin{pmatrix} \cos\alpha_2 & 0 & \sin\alpha_2 \\[0.5em] 0 & 1 & 0 \\[0.5em] -\sin\alpha_2 & 0 & \cos\alpha_2 \end{pmatrix},\quad \exp(\alpha_3X_3)= \begin{pmatrix} \cos\alpha_3 & -\sin\alpha_3 & 0 \\[0.5em] \sin\alpha_3 & \cos\alpha_3 & 0 \\[0.5em] 0 & 0 & 1 \end{pmatrix}

先绕 xx 轴转 α1\alpha_1 角度,再绕 yy 轴转 α2\alpha_2 角度,最后绕 zz 轴转 α3\alpha_3 可以得到 SO(3)\text{SO}(3) 群的所有群元操作

R(α1,α2,α3)=Rz(α3)Ry(α2)Rx(α1)=exp(α3X3)exp(α2X2)exp(α1X1)=(cosα3sinα30sinα3cosα30001)(cosα20sinα2010sinα20cosα2)(1000cosα1sinα10sinα1cosα1)=(cos(α2)cos(α3)cos(α3)sin(α1)sin(α2)cos(α1)sin(α3)cos(α1)cos(α3)sin(α2)+sin(α1)sin(α3)cos(α2)sin(α3)cos(α1)cos(α3)+sin(α1)sin(α2)sin(α3)cos(α1)sin(α2)sin(α3)cos(α3)sin(α1)sin(α2)cos(α2)sin(α1)cos(α1)cos(α2))\begin{aligned} &R(\alpha_1, \alpha_2, \alpha_3) = R_z(\alpha_3)R_y(\alpha_2)R_x(\alpha_1) = \exp(\alpha_3 X_3) \exp(\alpha_2 X_2) \exp(\alpha_1 X_1) \\[1em] &= \begin{pmatrix} \cos \alpha_3 & -\sin \alpha_3 & 0 \\[0.5em] \sin \alpha_3 & \cos \alpha_3 & 0 \\[0.5em] 0 & 0 & 1 \end{pmatrix} \begin{pmatrix} \cos \alpha_2 & 0 & \sin \alpha_2 \\[0.5em] 0 & 1 & 0 \\[0.5em] -\sin \alpha_2 & 0 & \cos \alpha_2 \end{pmatrix} \begin{pmatrix} 1 & 0 & 0 \\[0.5em] 0 & \cos \alpha_1 & -\sin \alpha_1 \\[0.5em] 0 & \sin \alpha_1 & \cos \alpha_1 \end{pmatrix} \\[2em] &= \begin{pmatrix} \cos(\alpha_2)\cos(\alpha_3) & \cos(\alpha_3)\sin(\alpha_1)\sin(\alpha_2) - \cos(\alpha_1)\sin(\alpha_3) & \cos(\alpha_1)\cos(\alpha_3)\sin(\alpha_2) + \sin(\alpha_1)\sin(\alpha_3) \\[0.5em] \cos(\alpha_2)\sin(\alpha_3) & \cos(\alpha_1)\cos(\alpha_3) + \sin(\alpha_1)\sin(\alpha_2)\sin(\alpha_3) & \cos(\alpha_1)\sin(\alpha_2)\sin(\alpha_3) - \cos(\alpha_3)\sin(\alpha_1) \\[0.5em] -\sin(\alpha_2) & \cos(\alpha_2)\sin(\alpha_1) & \cos(\alpha_1)\cos(\alpha_2) \end{pmatrix} \end{aligned}

只不过这种转动得到的物理含义也不是很明确,我们无法直接看出这是绕哪个轴转动多少角度,因此,这种参数化方式一般不常用。

注意,此时 R(α1,α2,α3)g(α1,α2,α3)R(\alpha_1, \alpha_2, \alpha_3) \neq g(\alpha_1, \alpha_2, \alpha_3),因为若矩阵 A,BA,B 不对易,则 eA+BeAeBe^{A+B} \neq e^A e^B,因此这种参数化方式和前两种参数化方式并不等价。
但却有相同的无穷小生成元。

欧拉角

欧拉角,对应参数 α,β,γ\alpha, \beta, \gamma

欧拉角转动看起来很奇怪,其按三步转动完成:

  1. 先绕 zz 轴转 α\alphaRz(α)R_z(\alpha)oxyzox1y1z1oxyz \quad \rightarrow \quad ox_1y_1z_1

  2. 再绕 y1y_1 轴转 β\betaRy1(β)R_{y_1}(\beta)ox1y1z1ox2y2z2ox_1y_1z_1 \quad \rightarrow \quad ox_2y_2z_2

  3. 最后绕 z2z_2 轴转 γ\gammaRz2(γ)R_{z_2}(\gamma)ox2y2z2ox3y3z3ox_2y_2z_2 \quad \rightarrow \quad ox_3y_3z_3

欧拉角转动

其定义式为

R(α,β,γ)=Rz2(γ)Ry1(β)Rz(α)R(\alpha,\beta,\gamma)=R_{z_2}(\gamma)R_{y_1}(\beta)R_z(\alpha)

我们知道有如下变换

Rz2(γ)=Ry1(β)Rz(γ)Ry1(β)1,Ry1(β)=Rz(α)Ry(β)Rz(α)1R_{z_2}(\gamma)=R_{y_1}(\beta)R_z(\gamma)R_{y_1}(\beta)^{-1},\quad R_{y_1}(\beta)=R_z(\alpha)R_y(\beta)R_z(\alpha)^{-1}

将其代入欧拉角定义式中,可得

R(α,β,γ)=Ry1(β)Rz(γ)Ry1(β)1Ry1(β)Rz(α)=Ry1(β)Rz(γ)Rz(α)=Rz(α)Ry(β)Rz(α)1Rz(γ)Rz(α)=Rz(α)Ry(β)Rz(γ)\begin{aligned} R(\alpha,\beta,\gamma)&=R_{y_1}(\beta)R_z(\gamma)R_{y_1}(\beta)^{-1}R_{y_1}(\beta)R_z(\alpha)=R_{y_1}(\beta)R_z(\gamma)R_z(\alpha) \\[1em] &=R_z(\alpha)R_y(\beta)R_z(\alpha)^{-1}R_z(\gamma)R_z(\alpha)=R_z(\alpha)R_y(\beta)R_z(\gamma) \end{aligned}

这样我们就得到了欧拉角的化简后的计算式

R(α,β,γ)=Rz(α)Ry(β)Rz(γ)\boxed{R(\alpha,\beta,\gamma)=R_z(\alpha)R_y(\beta)R_z(\gamma)}

可见欧拉角的定义式和计算式的转动顺序正好是相反的,计算式绕固定轴转动,更容易使用,其转动矩阵为

=(cosαsinα0sinαcosα0001)(cosβ0sinβ010sinβ0cosβ)(cosγsinγ0sinγcosγ0001)=(cosαcosβcosγsinαsinγsinαcosγcosαcosβsinγcosαsinβsinαcosβcosγ+cosαsinγcosαcosγsinαcosβsinγsinαsinβsinβcosγsinβsinγcosβ)\begin{aligned} &=\begin{pmatrix} \cos\alpha & -\sin\alpha & 0 \\[0.5em] \sin\alpha & \cos\alpha & 0 \\[0.5em] 0 & 0 & 1 \end{pmatrix} \begin{pmatrix} \cos\beta & 0 & \sin\beta \\[0.5em] 0 & 1 & 0 \\[0.5em] -\sin\beta & 0 & \cos\beta \end{pmatrix} \begin{pmatrix} \cos\gamma & -\sin\gamma & 0 \\[0.5em] \sin\gamma & \cos\gamma & 0 \\[0.5em] 0 & 0 & 1 \end{pmatrix} \\[2em] &=\begin{pmatrix} \cos\alpha\cos\beta\cos\gamma-\sin\alpha\sin\gamma & -\sin\alpha\cos\gamma-\cos\alpha\cos\beta\sin\gamma & \cos\alpha\sin\beta \\[0.5em] \sin\alpha\cos\beta\cos\gamma+\cos\alpha\sin\gamma & \cos\alpha\cos\gamma-\sin\alpha\cos\beta\sin\gamma & \sin\alpha\sin\beta \\[0.5em] -\sin\beta\cos\gamma & \sin\beta\sin\gamma & \cos\beta \end{pmatrix} \end{aligned}

使用欧拉角需要注意以下几点

  1. 欧拉角在不同领域中定义很可能不一样,工程上可能是 zxzzxzyxyyxy 等顺序,而我们这里是按 zyzzyz 顺序定义的

  2. α\alpha 相当于方位角 ϕ\phiβ\beta 相当于极角 θ\theta,但并不等同,因为欧拉角的转动轴会变化,存在先后顺序。

  3. 欧拉角的取值范围为 0βπ,0α,γ2π0\leq\beta\leq\pi, \quad 0\leq\alpha,\gamma\leq2\pi,当 β=0\beta=0,根据计算式为绕 zz 轴转动 α+γ\alpha+\gamma 角度,群元参数不唯一

  4. α\alphaγ\gamma 参数所对应的无穷小生成元一样,给有些研究造成不便。且我们只能求出 zzRz(α)R_z(\alpha)yyRy(β)R_y(\beta) 的无穷小生成元,而无法求出 xx 轴的无穷小生成元,因为我们根本没有定义绕 xx 轴转动的参数化形式。

欧拉角描述的优点可以通过矩阵元方便地定出参数 α,β,γ\alpha,\beta,\gammaRR 矩阵的最后一列所代表单位矢量的(极角,方位角)便是 (β,α)(\beta,\alpha),最后一行所代表单位矢量的(极角,方位角)便是 (β,πγ)(\beta,\pi-\gamma)

β=arccos(R33)α=arctan2(R13,R23)γ=πarctan2(R31,R32)\begin{aligned} & \beta=\operatorname{arccos}(R_{33}) \\[0.5em] & \alpha=\arctan2(R_{13},R_{23}) \\[0.5em] & \gamma=\pi-\arctan2(R_{31},R_{32}) \end{aligned}

其中 0βπ0α,γ2π\begin{array} {l}0\leq\beta\leq\pi \qquad 0\leq\alpha,\gamma\leq2\pi \end{array}

二维幺模幺正群SU(2)

无迹厄米矩阵

所有行列式为 112×22\times 2 幺正矩阵构成的群为 SU(2)\text{SU}(2) 群。先写出一个最一般的 2×22\times 2 矩阵,其行列式为 11

g=(abcd)detg=adbc=1g= \begin{pmatrix} a & b \\[0.5em] c & d \end{pmatrix} \qquad \det g=ad-bc=1

其逆矩阵的通用计算式和厄米共轭矩阵分别为

g1=1adbc(dbca)=(dbca)g+=(acbd)g^{-1}=\frac{1}{ad-bc} \begin{pmatrix} d & -b \\[0.5em] -c & a \end{pmatrix}= \begin{pmatrix} d & -b \\[0.5em] -c & a \end{pmatrix} \qquad g^+= \begin{pmatrix} a^* & c^* \\[0.5em] b^* & d^* \end{pmatrix}

幺正性要求逆矩阵和厄米共轭矩阵相等 g1=g+g^{-1}=g^+,可解得

a=d,c=ba^*=d,\quad c=-b^*

那么行列式为 11 的幺正矩阵的一般形式为

g(a,b)=(abba),a2+b2=1\boxed{\quad g(a,b)= \begin{pmatrix} a & b \\[0.5em] -b^* & a^* \end{pmatrix},\quad|a|^2+|b|^2=1}

若令 a=x0+ix3, b=x1+ix2a=x_0+ix_3,\ b=x_1+ix_2,则

g=(x0+ix3x1+ix2x1+ix2x0ix3)x02+x12+x22+x32=1g= \begin{pmatrix} x_0+ix_3 & x_1+ix_2 \\[0.5em] -x_1+ix_2 & x_0-ix_3 \end{pmatrix} \\[1em] x_0^2+x_1^2+x_2^2+x_3^2=1

四个实参量加上一个限制条件,说明 SU(2)\text{SU}(2) 的群流形为四维空间中的三维球面,半径为 11,是单连通的。

接下来为了探究 SU(2)\text{SU}(2)SO(3)\text{SO}(3) 群之间的关系,我们用 SU(2)\text{SU}(2) 矩阵对泡利矩阵进行相似变换。三个泡利矩阵分别为

σx=(0110)σy=(0ii0)σz=(1001){\sigma_{x}= \begin{pmatrix} 0 & 1 \\[0.5em] 1 & 0 \end{pmatrix}\qquad \sigma_{y}= \begin{pmatrix} 0 & -i \\[0.5em] i & 0 \end{pmatrix}\qquad \sigma_{z}= \begin{pmatrix} 1 & 0 \\[0.5em] 0 & -1 \end{pmatrix}}

这三个矩阵都是无迹厄米矩阵,这个特点使得三个泡利矩阵恰好可以构成所有二维无迹厄米矩阵的一组基。任意的二维无迹厄米矩阵 hh 的对角元为实数且互为相反数,非对角元为共轭复数,可以用三个实数 x,y,zx,y,z 来表示,这又恰好与位置矢量 r=(x,y,z)\boldsymbol{r}=(x,y,z) 一一对应

h=(zxiyx+iyz)=xσx+yσy+zσz=rσh= \begin{pmatrix} z & x-iy \\[0.5em] x+iy & -z \end{pmatrix}=x\sigma_x+y\sigma_y+z\sigma_z=r\cdot\sigma

这样就在二维无迹厄米矩阵和三维实矢量之间建立了一一映射关系,它们通过泡利矩阵相关联。也就是说,只要给定了三位空间中的矢量 r=(x,y,z)\boldsymbol{r}=(x,y,z),就可以唯一确定一个二维无迹厄米矩阵 h=rσh=r\cdot\sigma,反之亦然。

x=h12+h212,y=i(h12h21)2,z=h11x=\frac{h_{12}+h_{21}}{2},\qquad y=\frac{i(h_{12}-h_{21})}{2},\qquad z=h_{11}

在建立这样的对应之后,我们用 SU(2)\text{SU}(2) 中的一个群元 g=g(a,b)g=g(a,b) 对无迹厄米矩阵 h=rσh=r\cdot\sigma 进行相似变换

h=ghg1=(abba)(zxiyx+iyz)(abba)=g(rσ)g1=g(iriσi)g1=iri(gσig1)=iriσi=irijσjRji(g)=jσj(iRji(g)ri)=jσjrj\begin{aligned} h'&=ghg^{-1}=\begin{pmatrix}a&b\\-b^*&a^*\end{pmatrix}\begin{pmatrix}z&x-iy\\x+iy&-z\end{pmatrix}\begin{pmatrix}a^*&-b\\b^*&a\end{pmatrix}\\[1em] &=g(\boldsymbol{r}\cdot\boldsymbol{\sigma})g^{-1}=g(\sum_ir_i\sigma_i)g^{-1}=\sum_ir_i(\textcolor{red}{g\sigma_ig^{-1}})=\sum_ir_i\textcolor{red}{\sigma'_i}\\[1em] &=\sum_ir_i\textcolor{red}{\sum_j\sigma_jR_{ji}(g)}=\sum_j\sigma_j(\textcolor{blue}{\sum_iR_{ji}(g)r_i})=\sum_j\sigma_j\textcolor{blue}{r'_j} \end{aligned}

这表明,变换后的无迹厄米矩阵 hh' 仍然可以表示为新的位置矢量 r\boldsymbol{r}' 和泡利矩阵的线性组合形式

h=rσ=jrjσjh'=\boldsymbol{r}'\cdot\boldsymbol{\sigma}=\sum_jr'_j\sigma_j

其中用到了 σi=gσig1\sigma_i^{\prime}=g\sigma_ig^{-1}(σi)+=(g1)+σi+g+=gσig1=σi(\sigma_i^{\prime})^+=(g^{-1})^+\sigma_i^+g^+=g\sigma_ig^{-1}=\sigma_i^{\prime} 以及 Trσi=Trσi=0\mathrm{Tr}\sigma_i^{\prime}=\mathrm{Tr}\sigma_i=0,因此 σi\sigma_i^{\prime} 必可表示为泡利矩阵的线性组合 σi=jσjRji(g)\sigma_i^{\prime}=\sum_j\sigma_jR_{ji}(g),其中 Rji(g)R_{ji}(g) 是某个 3×33\times 3 矩阵的矩阵元。

也就是说矩阵 hhhh' 之间通过 gg 做相似变换得到,而矢量 r\boldsymbol{r}r\boldsymbol{r}' 之间通过 R(g)R(g) 做线性变换得到,它们之间的联系如下图所示

无迹厄米矩阵之间的变换

那么 ggR(g)R(g) 之间是什么关系呢?我们先写出 RR 的矩阵,通过 gσig1=jσjRji(g)g\sigma_ig^{-1}=\sum_j\sigma_jR_{ji}(g) 可得 RR 矩阵为

R(g)=(12(a2+a2b2b2)i2(a2+a2b2+b2)(ab+ab)i2(a2a2b2+b2)12(a2+a2+b2+b2)i(abab)(ab+ab)i(abab)(aabb))\begin{aligned} R(g)&=\begin{pmatrix} \dfrac{1}{2}(a^2+a^{*2}-b^2-b^{*2}) & \dfrac{i}{2}(-a^2+a^{*2}-b^2+b^{*2}) & -(ab+a^*b^*) \\[1em] \dfrac{i}{2}(a^2-a^{*2}-b^2+b^{*2}) & \dfrac{1}{2}(a^2+a^{*2}+b^2+b^{*2}) & -i(ab-a^*b^*) \\[1em] (a^*b+ab^*) & i(a^*b-ab^*) & (aa^*-bb^*) \end{pmatrix} \end{aligned}

R(g)R(g) 是由 gg 确定的,gg 的参数也是 R(g)R(g) 的参数,我们可以验证 R(g)R(g) 的每个矩阵元都是实数,并且是正交矩阵 RRT=RTR=IRR^T=R^T R=I,说明 R(g)R(g) 是实正交矩阵,属于 SO(3)\text{SO}(3) 群,代表的是三维空间中的转动。我们也可以从另外一个角度来得到这个结论

h=σr=(σ1σ2σ3)(r1r2r3)h=\boldsymbol{\sigma\cdot r}= \begin{pmatrix} \sigma_1 & \sigma_2 & \sigma_3 \end{pmatrix} \begin{pmatrix} r_1 \\[0.5em] r_2 \\[0.5em] r_3 \end{pmatrix}

h=ghg1=g(σr)g1=(gσg1)r=σr=σR(g)r=(σ1σ2σ3)R(g)(r1r2r3)=σR(g)r=σr\begin{aligned} h^{\prime} & =ghg^{-1}=g(\boldsymbol{\sigma}\cdot\boldsymbol{r})g^{-1}=(g\boldsymbol{\sigma}g^{-1})\cdot\boldsymbol{r}=\boldsymbol{\sigma}^{\prime}\cdot\boldsymbol{r}=\boldsymbol{\sigma}R(g)\cdot\boldsymbol{r} \\ & =\begin{pmatrix} \sigma_1 & \sigma_2 & \sigma_3 \end{pmatrix}R(g) \begin{pmatrix} r_1 \\[0.5em] r_2 \\[0.5em] r_3 \end{pmatrix}=\boldsymbol{\sigma}\cdot R(g)\boldsymbol{r}=\boldsymbol{\sigma}\cdot\boldsymbol{r}^{\prime} \end{aligned}

由于相似变换的行列式必然相等,所以 deth=detghg1=deth\det h^{\prime}=\det ghg^{-1}=\det h,分别计算可得

x2+y2+z2=x2+y2+z2x^{\prime2}+y^{\prime2}+z^{\prime2}=x^2+y^2+z^2

两边正是两个矢量的模长,结合 r=R(g)r\boldsymbol{r}^{\prime}=R(g)\boldsymbol{r},说明 R(g)R(g) 保持矢量的模长不变,因此 R(g)R(g) 是正交矩阵。我们现在需要确认这个正交矩阵的行列式是 +1+11-1。取 a=1,b=0a=1,b=0,则 g=I2g=I_2,此时 R(g)=I3R(g)=I_3detR(g)=1det R(g)=1,由于参数 a,ba,b 是连续变化的,因此行列式不会突变到 1-1,所以 detR(g)=1\det R(g)=1 恒成立。

以上两点说明:R(g)R(g) 是行列式为 11 的实正交矩阵,R(g)SO(3)R(g)\in\mathrm{SO}(3) 群。

SU(2) 到 SO(3) 的同态映射

上节中我们进行了以下过程:

gσig1=σi=jσjRji(g)g\sigma_ig^{-1}=\sigma'_i=\sum_j\sigma_jR_{ji}(g)

对泡利矩阵进行相似变换,得到新的泡利矩阵 σi\sigma'_i,并将其表示为原来泡利矩阵的线性组合,线性组合系数就是 R(g)R(g) 的每一列,这种做法和之前的内容:给定一组基,确定这组基下的群元表示矩阵是一样的。

若把 gg1\begin{aligned}g\square g^{-1}\end{aligned} 看作是线性变换 Γg\Gamma_g \square,把 σ1,σ2,σ3\sigma_1,\sigma_2,\sigma_3 看作是基,那么

Γg(σ1 σ2 σ3)=g(σ1 σ2 σ3)g1=(σ1 σ2 σ3)R(g)\Gamma_{g}(\sigma_{1}\ \sigma_{2}\ \sigma_{3})=g(\sigma_{1}\ \sigma_{2}\ \sigma_{3})g^{-1}=(\sigma_{1}\ \sigma_{2}\ \sigma_{3})R(g)

SO3\text{SO}{3} 中的矩阵 R(g)R(g) 构成了 SU(2)\text{SU}(2) 群元 gg 的一个三维表示。而表示是通过同态定义的,说明 SU(2)\text{SU}(2) 群到 SO(3)\text{SO}(3) 群存在一个同态映射,R(g)R(g) 自然就是这个同态映射:

gσg1=σR(g)g\boldsymbol{\sigma}g^{-1}=\boldsymbol{\sigma}R(g)

gg 替换为 g-g,上式应该仍旧成立,那么

σR(g)=(g)σ(g)1=gσg1=σR(g)\boldsymbol{\sigma}R(-g)=(-g)\boldsymbol{\sigma}(-g)^{-1}=g\boldsymbol{\sigma}g^{-1}=\boldsymbol{\sigma}R(g)

所以有

R(g)=R(g)R(-g)=R(g)

SU(2)\text{SU}(2) 中的群元 g(a,b)g(a,b)g(a,b)=g(a,b)-g(a,b)=g(-a,-b) 都映射到 SO(3)\text{SO}(3) 群中的同一个群元 R(a,b)=R(g(a,b))=R(a,b)R(a,b)=R\left(g(a,b)\right)=R(-a,-b)

SU(2)\text{SU}(2)SO(3)\text{SO}(3) 间是二对一的同态,同态核为 Z2={I2,I2}Z_2=\{I_2,-I_2\},又 SU(2)\text{SU}(2) 单连通而 SO(3)\text{SO}(3) 双连通,因此 SU(2)\text{SU}(2)SO(3)\text{SO}(3)覆盖群

欧拉角对应的 SU(2) 参数范围

下面来看两类特殊的 SU(2)\text{SU}(2) 群元

  1. a=exp(iγ2),b=0a=\exp\left(-i\dfrac{\gamma}{2}\right),b=0

    g1(γ)=g(eiγ2,0)=(eiγ200eiγ2)g_1(\gamma)=g \begin{pmatrix} e^{-i\frac{\gamma}{2}},0 \end{pmatrix}= \begin{pmatrix} e^{-i\frac{\gamma}{2}} & 0 \\[0.5em] 0 & e^{i\frac{\gamma}{2}} \end{pmatrix}

    这个对角矩阵映射的 SO(3)\text{SO}(3) 群元为绕 zzγ\gamma 角度的转动

    R(g(eiγ2,0))=R(eiγ2,0)=(cosγsinγ0sinγcosγ0001)=Rz(γ)R\left(g\left(e^{-i\frac{\gamma}{2}},0\right)\right)=R\left(e^{-i\frac{\gamma}{2}},0\right)= \begin{pmatrix} \cos\gamma & -\sin\gamma & 0 \\[0.5em] \sin\gamma & \cos\gamma & 0 \\[0.5em] 0 & 0 & 1 \end{pmatrix}=R_z(\gamma)

  2. a=cosβ2,b=sinβ2a=\cos\dfrac{\beta}{2},b=-\sin\dfrac{\beta}{2}

    g2(β)=g(cosβ2,sinβ2)=(cosβ2sinβ2sinβ2cosβ2)g_2(\beta)=g\left(\cos\dfrac{\beta}{2},-\sin\dfrac{\beta}{2}\right)= \begin{pmatrix} \cos\dfrac{\beta}{2} & -\sin\dfrac{\beta}{2} \\[1em] \sin\dfrac{\beta}{2} & \cos\dfrac{\beta}{2} \end{pmatrix}

    这个纯实的 SU(2)\text{SU}(2) 群元对应的 SO(3)\text{SO}(3) 群元为绕 yyβ\beta 角度的转动

    R(g)=R(cosβ2,sinβ2)=(cosβ0sinβ010sinβ0cosβ)=Ry(β)R(g)=R\left(\cos\frac{\beta}{2},-\sin\frac{\beta}{2}\right)= \begin{pmatrix} \cos\beta & 0 & \sin\beta \\[0.5em] 0 & 1 & 0 \\[0.5em] -\sin\beta & 0 & \cos\beta \end{pmatrix}=R_y(\beta)

对角的 SU(2)\text{SU}(2) 群元对应 SO(3)\text{SO}(3) 中绕 zz 轴的转动,纯实的 SU(2)\text{SU}(2) 群元对应 SO(3)\text{SO}(3) 中绕 yy 轴的转动。那么,欧拉角转动表示的旋转矩阵 R(α,β,γ)=Rz(α)Ry(β)Rz(γ)R(\alpha,\beta,\gamma)=R_z(\alpha)R_y(\beta)R_z(\gamma) 对应的 SU(2)\text{SU}(2) 群元为

g(α,β,γ)=g1(α)g2(β)g1(γ)=(eiα+γ2cosβ2 eiαγ2sinβ2eiαγ2sinβ2 eiα+γ2cosβ2)=exp(ασz2i)exp(βσy2i)exp(γσz2i)\begin{aligned} g(\alpha,\beta,\gamma)&=g_1(\alpha)g_2(\beta)g_1(\gamma)= \begin{pmatrix} e^{-i\dfrac{\alpha+\gamma}{2}}\cos\dfrac{\beta}{2} &\ & -e^{-i\dfrac{\alpha-\gamma}{2}}\sin\dfrac{\beta}{2} \\[0.5em] e^{i\dfrac{\alpha-\gamma}{2}}\sin\dfrac{\beta}{2} &\ & e^{i\dfrac{\alpha+\gamma}{2}}\cos\dfrac{\beta}{2} \end{pmatrix} \\[2em] &=\exp\left(\alpha\frac{\sigma_z}{2i}\right)\exp\left(\beta\frac{\sigma_y}{2i}\right)\exp\left(\gamma\frac{\sigma_z}{2i}\right) \end{aligned}

SO(3)\text{SO}(3) 群中欧拉角范围为 Dso(3):0βπ,πα,γπ\begin{aligned} \mathcal{D}_{so(3)}:\quad 0 \leq \beta \leq \pi, \quad -\pi \leq \alpha, \gamma \leq \pi \end{aligned},每组 (α,β,γ)(\alpha,\beta,\gamma) 决定一个旋转 RR,但一个旋转矩阵 RR 应该对应两个 SU(2)\text{SU}(2) 矩阵 ggg-g,那为什么我们只能找到一组 g(α,β,γ)g(\alpha,\beta,\gamma) 呢?

这是因为 SU(2)\text{SU}(2) 群中欧拉角的取值范围和 SO(3)\text{SO}(3) 群中欧拉角的取值范围不一样。若把 SU(2)\text{SU}(2) 群中欧拉角限定在 SO(3)\text{SO}(3) 群中的范围 Dso(3)\mathcal{D}_{so(3)},那么只能得到一半群元。为了方便研究,我们定义 ξ=α+γ2,η=αγ2\xi=\dfrac{\alpha+\gamma}{2},\eta=\dfrac{\alpha-\gamma}{2},则 α=ξ+η,γ=ξη\alpha=\xi+\eta,\gamma=\xi-\eta

g(α,β,γ)=(eiα+γ2cosβ2eiαγ2sinβ2eiαγ2sinβ2eiα+γ2cosβ2)=(eiξcosβ2eiηsinβ2eiηsinβ2eiξcosβ2)g(\alpha,\beta,\gamma)= \begin{pmatrix} e^{-i\frac{\alpha+\gamma}{2}}\cos\dfrac{\beta}{2} & -e^{-i\frac{\alpha-\gamma}{2}}\sin\dfrac{\beta}{2} \\[1em] e^{i\frac{\alpha-\gamma}{2}}\sin\dfrac{\beta}{2} & e^{i\frac{\alpha+\gamma}{2}}\cos\dfrac{\beta}{2} \end{pmatrix}= \begin{pmatrix} e^{-i\xi}\cos\dfrac{\beta}{2} & -e^{-i\eta}\sin\dfrac{\beta}{2} \\[1em] e^{i\eta}\sin\dfrac{\beta}{2} & e^{i\xi}\cos\dfrac{\beta}{2} \end{pmatrix}

只有 ξ,η\xi,\eta 独立[π,π][-\pi,\pi] 内变化,才能得到 SU(2)\text{SU}(2) 群的所有群元。如下图所示,蓝色区域 DSU(2)\mathcal{D}_{\text{SU}(2)} 给出 SU(2)\text{SU}(2) 所有元的参数范围,而图中红色区域代表 DSO(3)\mathcal{D}_{\text{SO}(3)},其面积为 DSU(2)\mathcal{D}_{\text{SU}(2)} 面积的一半,这就是刚刚只能找到一组 g(α,β,γ)g(\alpha,\beta,\gamma) 的原因,面积必须再增加一倍才能给出所有 SU(2)\text{SU}(2) 群元,比如增加两个黄色部分的任意一个,由于周期性,可以移动并填满空余的蓝色区域。

SU(2)与SO(3)的对应

所以根据黄色部分的选取,SU(2)\text{SU}(2) 群中欧拉角的参数范围可以有两种选择

β[0,π],α[π,π],γ[π,3π] 或β[0,π],α[π,3π],γ[π,π] 或 \begin{aligned} &\beta\in[0,\pi],\alpha\in[-\pi,\pi],\gamma\in[-\pi,3\pi]\text{ 或} \\[1em] &\beta\in[0,\pi],\alpha\in[-\pi,3\pi],\gamma\in[-\pi,\pi]\text{ 或 }\ldots \end{aligned}