三维幺模正交群SO(3)
O(3): 三维实正交群,所有的 3×3 正交矩阵 R,detR=±1
O(3)=SO(3)⊗Ci=SO(3)⊕i SO(3)
SO(3): 三维幺模实正交群,O(3) 的子群: detR=1 的分支,也称“正当转动群”,“完全转动群”
RRT=RTR=I,detR=1,x′=Rx
x1′2+x2′2+x3′2=x12+x22+x32
SO(3) 为三参数李群,可有不同参数化形式:
-
由无穷小生成元生成,对应参数 α1,α2,α3
-
绕 n 方向转轴转动 ω 角度,对应参数 n(θ,ϕ),ω
-
先后绕 x,y,z 轴转一定角度,对应参数 α1,α2,α3
-
欧拉角,对应参数 α,β,γ
无穷小生成元
由无穷小生成元生成,对应参数 α1,α2,α3
可以得到 SO(3) 的三个无穷小生成元:
X1=0000010−10,X2=00−1000100,X3=010−100000
将无穷小生成元 e 指数化,可生成有限群元 Rx(α1),Ry(α2),Rz(α3):
exp(α1X1)=1000cosα1sinα10−sinα1cosα1,exp(α2X2)=cosα20−sinα2010sinα20cosα2,exp(α3X3)=cosα3sinα30−sinα3cosα30001
可见,X1,X2,X3 分别对应绕 x,y,z 轴转 α1,α2,α3 角度的转动。将这三个参数按无穷小生成元的方式构造任意一个群元
g(α1,α2,α3)=exp(α1X1+α2X2+α3X3)=exp0α3−α2−α30α1α2−α10
原则上,当一个矩阵作为指数幂时,需要进行泰勒展开,展开后的结果为
=α21α12+cos(α)(α22+α32)−cos(α)α1α2+α1α2+αsin(α)α3−αsin(α)α2−cos(α)α1α3+α1α3−cos(α)α1α2+α1α2−αsin(α)α3α22+cos(α)(α12+α32)αsin(α)α1−cos(α)α2α3+α2α3αsin(α)α2−cos(α)α1α3+α1α3−αsin(α)α1−cos(α)α2α3+α2α3α32+cos(α)(α12+α22)
其中 α=α12+α22+α32。
绕轴转动
绕 n 方向转轴转动 ω 角度,对应参数 n(θ,ϕ),ω
设 n=(n1,n2,n3) 为转轴方向的单位矢量,且 n12+n22+n32=1,ω 为绕转轴 n 转动的角度。为方便起见,我们将转轴方向用球坐标表示:
n=(n1,n2,n3)=(sinθcosϕ,sinθsinϕ,cosθ)
要想描述绕 n 方向转轴转动 ω 角度的转动 R(n,ω),可以将转轴转至 z 轴方向,绕 z 轴转动 ω 角度,再将 z 轴转回原来位置。若定义 S=S(θ,ϕ) 把 (0,0,1) 方向转到 n 方向,则有
R(n,ω)=SRz(ω)S−1
S 是不唯一的,我们找到一个合适的 S 即可:
S=Rz(ϕ)Ry(θ)=cosθcosϕcosθsinϕ−sinθ−sinϕcosϕ0sinθcosϕsinθsinϕcosθ⇒S001=n1n2n3
只要 S 为 3×3 正交矩阵且最后一列蓝色部分相同,即可满足要求。
先计算 z 方向的无穷小生成元的变换为
SX3S−1=0cosθ−sinθsinϕ−cosθ0sinθcosϕsinθsinϕ−sinθcosϕ0=0n3−n2−n30n1n2−n10=n1X1+n2X2+n3X3=n⋅X
再计算绕 R(n,ω) 的转动矩阵:
R(n,ω)=SRz(ω)S−1=Sexp(ωX3)S−1=exp(SωX3S−1)=exp(ωn⋅X)=exp(ωn1X1+ωn2X2+ωn3X3)=g(ωn1,ωn2,ωn3)=g(ωn)
即,绕任意转轴 n 转动 ω 的参数化为
R(n,ω)=exp(ωn⋅X)=g(ωn)
这就和第(1)种无穷小生成元的参数化方式是一致的,只是参数从 α→ωn,可见(1)中由无穷小生成元指数化的参数化方式就是绕某个轴的转动,(1)参数化形式可写为
g(α)=g(α1,α2,α3)=exp(α⋅X)=exp(ααα⋅X)=g(ααα)=R(αα,α)
转轴为 n=αα=α1(α1,α2,α3),转角为 ω=α=a12+α22+α32。把 n,ω 代入 g(α) 的矩阵表达式,即可得到绕任意转轴转动的矩阵形式 R(n,ω)=
n12+(n22+n32)cosωn1n2(1−cosω)+n3sinωn1n3(1−cosω)−n2sinωn1n2(1−cosω)−n3sinωn22+(n12+n32)cosωn2n3(1−cosω)+n1sinωn1n3(1−cosω)+n2sinωn2n3(1−cosω)−sin(ω)n1n32+(n12+n22)cosω
绕任意转轴 n 转动 ω 角度的形式具有性质
R(n,ω)≡R(−n,2π−ω)
这说明绕相反方向转动 2π−ω 角度,和绕正方向转动 ω 角度是等价的,这也就限定了参数的取值范围
n(θ,ϕ){0≤θ≤π0≤ϕ≤2π,0≤ω≤π
可将参数取为半径为 π 的球体内的所有点的球坐标(ω,θ,ϕ),如下图所示:
球内部的每一个点对应一个群元,根据 R(n,π)≡R(−n,π),球面上任意直径两端的点虽然在参数空间内是不同的两点,但对应同一个群元。若在参数空间内任取两个点 P,Q,任意连接 P,Q 的连续变化曲线 PQ,无法通过连续变化和 PB1B2Q 重合(B1,B2 代表同一个群元,在群元上是连续的),分成了两组曲线,说明 SO(3) 群是双连通的。
三个方向直接转动
(3)先后绕 x,y,z 轴转一定角度,对应参数 α1,α2,α3
exp(α1X1)=1000cosα1sinα10−sinα1cosα1,exp(α2X2)=cosα20−sinα2010sinα20cosα2,exp(α3X3)=cosα3sinα30−sinα3cosα30001
先绕 x 轴转 α1 角度,再绕 y 轴转 α2 角度,最后绕 z 轴转 α3 可以得到 SO(3) 群的所有群元操作
R(α1,α2,α3)=Rz(α3)Ry(α2)Rx(α1)=exp(α3X3)exp(α2X2)exp(α1X1)=cosα3sinα30−sinα3cosα30001cosα20−sinα2010sinα20cosα21000cosα1sinα10−sinα1cosα1=cos(α2)cos(α3)cos(α2)sin(α3)−sin(α2)cos(α3)sin(α1)sin(α2)−cos(α1)sin(α3)cos(α1)cos(α3)+sin(α1)sin(α2)sin(α3)cos(α2)sin(α1)cos(α1)cos(α3)sin(α2)+sin(α1)sin(α3)cos(α1)sin(α2)sin(α3)−cos(α3)sin(α1)cos(α1)cos(α2)
只不过这种转动得到的物理含义也不是很明确,我们无法直接看出这是绕哪个轴转动多少角度,因此,这种参数化方式一般不常用。
注意,此时 R(α1,α2,α3)=g(α1,α2,α3),因为若矩阵 A,B 不对易,则 eA+B=eAeB,因此这种参数化方式和前两种参数化方式并不等价。
但却有相同的无穷小生成元。
欧拉角
欧拉角,对应参数 α,β,γ
欧拉角转动看起来很奇怪,其按三步转动完成:
-
先绕 z 轴转 α 角 Rz(α) : oxyz→ox1y1z1
-
再绕 y1 轴转 β 角 Ry1(β) : ox1y1z1→ox2y2z2
-
最后绕 z2 轴转 γ 角 Rz2(γ) : ox2y2z2→ox3y3z3
其定义式为
R(α,β,γ)=Rz2(γ)Ry1(β)Rz(α)
我们知道有如下变换
Rz2(γ)=Ry1(β)Rz(γ)Ry1(β)−1,Ry1(β)=Rz(α)Ry(β)Rz(α)−1
将其代入欧拉角定义式中,可得
R(α,β,γ)=Ry1(β)Rz(γ)Ry1(β)−1Ry1(β)Rz(α)=Ry1(β)Rz(γ)Rz(α)=Rz(α)Ry(β)Rz(α)−1Rz(γ)Rz(α)=Rz(α)Ry(β)Rz(γ)
这样我们就得到了欧拉角的化简后的计算式
R(α,β,γ)=Rz(α)Ry(β)Rz(γ)
可见欧拉角的定义式和计算式的转动顺序正好是相反的,计算式绕固定轴转动,更容易使用,其转动矩阵为
=cosαsinα0−sinαcosα0001cosβ0−sinβ010sinβ0cosβcosγsinγ0−sinγcosγ0001=cosαcosβcosγ−sinαsinγsinαcosβcosγ+cosαsinγ−sinβcosγ−sinαcosγ−cosαcosβsinγcosαcosγ−sinαcosβsinγsinβsinγcosαsinβsinαsinβcosβ
使用欧拉角需要注意以下几点
-
欧拉角在不同领域中定义很可能不一样,工程上可能是 zxz 或 yxy 等顺序,而我们这里是按 zyz 顺序定义的
-
α 相当于方位角 ϕ,β 相当于极角 θ,但并不等同,因为欧拉角的转动轴会变化,存在先后顺序。
-
欧拉角的取值范围为 0≤β≤π,0≤α,γ≤2π,当 β=0,根据计算式为绕 z 轴转动 α+γ 角度,群元参数不唯一
-
α 和 γ 参数所对应的无穷小生成元一样,给有些研究造成不便。且我们只能求出 z 轴 Rz(α) 和 y 轴 Ry(β) 的无穷小生成元,而无法求出 x 轴的无穷小生成元,因为我们根本没有定义绕 x 轴转动的参数化形式。
欧拉角描述的优点可以通过矩阵元方便地定出参数 α,β,γ:R 矩阵的最后一列所代表单位矢量的(极角,方位角)便是 (β,α),最后一行所代表单位矢量的(极角,方位角)便是 (β,π−γ):
β=arccos(R33)α=arctan2(R13,R23)γ=π−arctan2(R31,R32)
其中 0≤β≤π0≤α,γ≤2π
二维幺模幺正群SU(2)
无迹厄米矩阵
所有行列式为 1 的 2×2 幺正矩阵构成的群为 SU(2) 群。先写出一个最一般的 2×2 矩阵,其行列式为 1
g=(acbd)detg=ad−bc=1
其逆矩阵的通用计算式和厄米共轭矩阵分别为
g−1=ad−bc1(d−c−ba)=(d−c−ba)g+=(a∗b∗c∗d∗)
幺正性要求逆矩阵和厄米共轭矩阵相等 g−1=g+,可解得
a∗=d,c=−b∗
那么行列式为 1 的幺正矩阵的一般形式为
g(a,b)=(a−b∗ba∗),∣a∣2+∣b∣2=1
若令 a=x0+ix3, b=x1+ix2,则
g=(x0+ix3−x1+ix2x1+ix2x0−ix3)x02+x12+x22+x32=1
四个实参量加上一个限制条件,说明 SU(2) 的群流形为四维空间中的三维球面,半径为 1,是单连通的。
接下来为了探究 SU(2) 和 SO(3) 群之间的关系,我们用 SU(2) 矩阵对泡利矩阵进行相似变换。三个泡利矩阵分别为
σx=(0110)σy=(0i−i0)σz=(100−1)
这三个矩阵都是无迹厄米矩阵,这个特点使得三个泡利矩阵恰好可以构成所有二维无迹厄米矩阵的一组基。任意的二维无迹厄米矩阵 h 的对角元为实数且互为相反数,非对角元为共轭复数,可以用三个实数 x,y,z 来表示,这又恰好与位置矢量 r=(x,y,z) 一一对应
h=(zx+iyx−iy−z)=xσx+yσy+zσz=r⋅σ
这样就在二维无迹厄米矩阵和三维实矢量之间建立了一一映射关系,它们通过泡利矩阵相关联。也就是说,只要给定了三位空间中的矢量 r=(x,y,z),就可以唯一确定一个二维无迹厄米矩阵 h=r⋅σ,反之亦然。
x=2h12+h21,y=2i(h12−h21),z=h11
在建立这样的对应之后,我们用 SU(2) 中的一个群元 g=g(a,b) 对无迹厄米矩阵 h=r⋅σ 进行相似变换
h′=ghg−1=(a−b∗ba∗)(zx+iyx−iy−z)(a∗b∗−ba)=g(r⋅σ)g−1=g(i∑riσi)g−1=i∑ri(gσig−1)=i∑riσi′=i∑rij∑σjRji(g)=j∑σj(i∑Rji(g)ri)=j∑σjrj′
这表明,变换后的无迹厄米矩阵 h′ 仍然可以表示为新的位置矢量 r′ 和泡利矩阵的线性组合形式
h′=r′⋅σ=j∑rj′σj
其中用到了 σi′=gσig−1、(σi′)+=(g−1)+σi+g+=gσig−1=σi′ 以及 Trσi′=Trσi=0,因此 σi′ 必可表示为泡利矩阵的线性组合 σi′=∑jσjRji(g),其中 Rji(g) 是某个 3×3 矩阵的矩阵元。
也就是说矩阵 h 和 h′ 之间通过 g 做相似变换得到,而矢量 r 和 r′ 之间通过 R(g) 做线性变换得到,它们之间的联系如下图所示
那么 g 和 R(g) 之间是什么关系呢?我们先写出 R 的矩阵,通过 gσig−1=∑jσjRji(g) 可得 R 矩阵为
R(g)=21(a2+a∗2−b2−b∗2)2i(a2−a∗2−b2+b∗2)(a∗b+ab∗)2i(−a2+a∗2−b2+b∗2)21(a2+a∗2+b2+b∗2)i(a∗b−ab∗)−(ab+a∗b∗)−i(ab−a∗b∗)(aa∗−bb∗)
R(g) 是由 g 确定的,g 的参数也是 R(g) 的参数,我们可以验证 R(g) 的每个矩阵元都是实数,并且是正交矩阵 RRT=RTR=I,说明 R(g) 是实正交矩阵,属于 SO(3) 群,代表的是三维空间中的转动。我们也可以从另外一个角度来得到这个结论
h=σ⋅r=(σ1σ2σ3)r1r2r3
h′=ghg−1=g(σ⋅r)g−1=(gσg−1)⋅r=σ′⋅r=σR(g)⋅r=(σ1σ2σ3)R(g)r1r2r3=σ⋅R(g)r=σ⋅r′
由于相似变换的行列式必然相等,所以 deth′=detghg−1=deth,分别计算可得
x′2+y′2+z′2=x2+y2+z2
两边正是两个矢量的模长,结合 r′=R(g)r,说明 R(g) 保持矢量的模长不变,因此 R(g) 是正交矩阵。我们现在需要确认这个正交矩阵的行列式是 +1 或 −1。取 a=1,b=0,则 g=I2,此时 R(g)=I3,detR(g)=1,由于参数 a,b 是连续变化的,因此行列式不会突变到 −1,所以 detR(g)=1 恒成立。
以上两点说明:R(g) 是行列式为 1 的实正交矩阵,R(g)∈SO(3) 群。
SU(2) 到 SO(3) 的同态映射
上节中我们进行了以下过程:
gσig−1=σi′=j∑σjRji(g)
对泡利矩阵进行相似变换,得到新的泡利矩阵 σi′,并将其表示为原来泡利矩阵的线性组合,线性组合系数就是 R(g) 的每一列,这种做法和之前的内容:给定一组基,确定这组基下的群元表示矩阵是一样的。
若把 g□g−1 看作是线性变换 Γg□,把 σ1,σ2,σ3 看作是基,那么
Γg(σ1 σ2 σ3)=g(σ1 σ2 σ3)g−1=(σ1 σ2 σ3)R(g)
则 SO3 中的矩阵 R(g) 构成了 SU(2) 群元 g 的一个三维表示。而表示是通过同态定义的,说明 SU(2) 群到 SO(3) 群存在一个同态映射,R(g) 自然就是这个同态映射:
gσg−1=σR(g)
将 g 替换为 −g,上式应该仍旧成立,那么
σR(−g)=(−g)σ(−g)−1=gσg−1=σR(g)
所以有
R(−g)=R(g)
SU(2) 中的群元 g(a,b) 和 −g(a,b)=g(−a,−b) 都映射到 SO(3) 群中的同一个群元 R(a,b)=R(g(a,b))=R(−a,−b)。
SU(2) 到 SO(3) 间是二对一的同态,同态核为 Z2={I2,−I2},又 SU(2) 单连通而 SO(3) 双连通,因此 SU(2) 是 SO(3) 的覆盖群。
欧拉角对应的 SU(2) 参数范围
下面来看两类特殊的 SU(2) 群元
-
当 a=exp(−i2γ),b=0
g1(γ)=g(e−i2γ,0)=(e−i2γ00ei2γ)
这个对角矩阵映射的 SO(3) 群元为绕 z 轴 γ 角度的转动
R(g(e−i2γ,0))=R(e−i2γ,0)=cosγsinγ0−sinγcosγ0001=Rz(γ)
-
当 a=cos2β,b=−sin2β
g2(β)=g(cos2β,−sin2β)=cos2βsin2β−sin2βcos2β
这个纯实的 SU(2) 群元对应的 SO(3) 群元为绕 y 轴 β 角度的转动
R(g)=R(cos2β,−sin2β)=cosβ0−sinβ010sinβ0cosβ=Ry(β)
对角的 SU(2) 群元对应 SO(3) 中绕 z 轴的转动,纯实的 SU(2) 群元对应 SO(3) 中绕 y 轴的转动。那么,欧拉角转动表示的旋转矩阵 R(α,β,γ)=Rz(α)Ry(β)Rz(γ) 对应的 SU(2) 群元为
g(α,β,γ)=g1(α)g2(β)g1(γ)=e−i2α+γcos2βei2α−γsin2β −e−i2α−γsin2βei2α+γcos2β=exp(α2iσz)exp(β2iσy)exp(γ2iσz)
SO(3) 群中欧拉角范围为 Dso(3):0≤β≤π,−π≤α,γ≤π,每组 (α,β,γ) 决定一个旋转 R,但一个旋转矩阵 R 应该对应两个 SU(2) 矩阵 g 和 −g,那为什么我们只能找到一组 g(α,β,γ) 呢?
这是因为 SU(2) 群中欧拉角的取值范围和 SO(3) 群中欧拉角的取值范围不一样。若把 SU(2) 群中欧拉角限定在 SO(3) 群中的范围 Dso(3),那么只能得到一半群元。为了方便研究,我们定义 ξ=2α+γ,η=2α−γ,则 α=ξ+η,γ=ξ−η
g(α,β,γ)=e−i2α+γcos2βei2α−γsin2β−e−i2α−γsin2βei2α+γcos2β=e−iξcos2βeiηsin2β−e−iηsin2βeiξcos2β
只有 ξ,η 独立在 [−π,π] 内变化,才能得到 SU(2) 群的所有群元。如下图所示,蓝色区域 DSU(2) 给出 SU(2) 所有元的参数范围,而图中红色区域代表 DSO(3),其面积为 DSU(2) 面积的一半,这就是刚刚只能找到一组 g(α,β,γ) 的原因,面积必须再增加一倍才能给出所有 SU(2) 群元,比如增加两个黄色部分的任意一个,由于周期性,可以移动并填满空余的蓝色区域。
所以根据黄色部分的选取,SU(2) 群中欧拉角的参数范围可以有两种选择
β∈[0,π],α∈[−π,π],γ∈[−π,3π] 或β∈[0,π],α∈[−π,3π],γ∈[−π,π] 或 …