在经典力学中,角动量是不太重要的,但在量子力学中,角动量十分重要,为什么?在分子、原子和核光谱学中,对角动量的深入理解是必不可少的,角动量的考量在散射和碰撞问题以及束缚态问题中起着重要作用。此外,角动量概念还有重要的推广——例如核物理中的同位旋,粒子物理中的 SU(3)、SU(2)⊗U(1) 等等。
三维空间的经典转动
三维空间中的转动
一个转动 Rn^(α) 由以下两点确定:
- 沿转动轴的单位矢量 n^(θ,ϕ)
- 绕 n^ 旋转的角度 α∈[0,2π]
这说明刻画三维空间中的转动需要三个实参数。下图所示的是一个绕 z 轴旋转 α 的转动 Rz^(α)v=v′ 及这个转动在 xy 平面上的投影。
根据投影我们得到以下关系
vx′vy′vz′=∣vxy′∣cos(θ+α)=∣vxy∣(cosθcosα−sinθsinα)=vxcosα−vysinα=∣vxy′∣sin(θ+α)=∣vxy∣(sinθcosα+cosθsinα)=vxsinα+vycosα=vz
我们可以将上面的关系写成矩阵形式
vx′vy′vz′=cosαsinα0−sinαcosα0001vxvyvz
那么这个三维转动矩阵为
Rz^(α)=cosαsinα0−sinαcosα0001
类似地,我们可以得到绕 x 轴和 y 轴的转动矩阵
Rx^(α)=1000cosαsinα0−sinαcosαRy^(α)=cosα0−sinα010sinα0cosα
注意绕 y 轴转动的手性。
因为三个矩阵 Rx^(α),Ry^(α),Rz^(α) 能维持向量的模不变,所以它们都是实正交矩阵,且行列式均为 1,即它们都是 SO(3) 群的元素。
无穷小转动
就像无穷小平移一样,我们会经常使用无限小转动。在一个无穷小转动下,
变化的长度为弧长,方向也是切线方向,所以有
∣Δv∣=rε=∣v∣sinθε⇒Δv=n^×vε
在该旋转下,三维矢量 v 的变换形式(保留至 ε 的一阶项)为:
v′=Rn^(ε)v=v+Δv=v+εn^×v
我们分别在 Rx^(α),Ry^(α),Rz^(α) 中取无穷小转动的泰勒展开 cosε≈1,sinε=ε,那么
Rx^(ε)=10001ε0−ε1Ry^(ε)=10−ε010ε01Rz^(ε)=1ε0−ε10001
若定义三个纯虚矩阵
I1≡00000i0−i0I2≡00−i000i00I3≡0i0−i00000
那么我们可以将无穷小转动矩阵写成
Rχ^(ε)=1−iεI1,Ry^(ε)=1−iεI2,Rz^(ε)=1−iεI3
这三个 I 矩阵都是厄米矩阵,其实就是将 σy 嵌入到 3×3 矩阵中得到的。这三个矩阵就是 SO(3) 群基本表示的无穷小生成元,和我们之前提到的幺正变换的生成元 F 类似,只不过在这里是矩阵形式的。生成元具有以下性质:
-
(Ii)jk=−iεijk
-
[Ii,Ij]=iεijkIk
- 这似乎和自旋算符、泡利算符的对易关系相似?
- 经典的三维转动和量子中自旋为 1 的转动之间只相差一个幺正变换
-
I12=000010001,I22=100000001,I32=100010000
I2≡I12+I22+I32=2
我们知道,L2=l(l+1)ℏ2(卡西米尔算符),所以三维空间的转动对应角动量量子数 l=1。
可以看出 Ij3=Ij,因此生成元的偶数次方都是平方 Ij2n=Ij2,奇数次方都是自身 Ij2n+1=Ij。
-
eiαIj=1+Ij2(cosα−1)+isinαIj
-
任意方向的无穷小转动可用生成元写为
Rn^(ε)=1−iεI⋅n
任意方向的有限转动可写为
Rn^(α)=e−iαI⋅n
由于 Ii 是纯虚矩阵和厄米矩阵,所以 e−iαI⋅n 是一个实正交矩阵
不同轴转动之间的关系
- 有限旋转:绕不同轴的有限旋转不对易
- 无穷小旋转:当保留至二阶 ε2 项时,绕不同轴的转动不对易
考虑两个转轴 n^ 和 m^,它们通过一个变换 R 相关联,即 n^=Rm^。那么有
Rn^(α)=RRm^(α)R−1
Rm^(α)R−1v=R−1Rn^(α)v
对上图,看作两个圆锥整体之间的变换更好理解
任意转轴 n^ 可由 z^ 轴变换得到
Rz^(ϕ)Ry^(θ)z^=n^
此时 R=Rz^(ϕ)Ry^(θ),所以绕任意轴 n^ 可由绕 z 轴的转动变换而来
Rn^(α)=Rz^(ϕ)Ry^(θ)Rz^(α)Ry^−1(θ)Rz^−1(ϕ)
经典力学中的欧拉转动
欧拉转动将任意转动通过三步实现:Rz′′(γ)Ry′(β)Rz(α)
-
绕 z 轴转动 α 角
-
绕新的 y′ 轴转动 β 角
-
绕新的 z′′ 轴转动 γ 角
从第二步开始,转动就沿着新的轴转动,我们需要找到这些新轴转动
y^′=Rz(α)y^⇒Ry′(β)=Rz(α)Ry(β)Rz−1(α)
z^′′=Ry′(β)z^⇒Rz′′(γ)=Ry′(β)Rz(γ)Ry′−1(β)
将上两式代入欧拉转动表达式中,得到
Rz′′(γ)Ry′(β)Rz(α)=Rz(α)Ry(β)Rz−1(α)Rz(γ)Rz(α)Ry−1(β)Rz−1(α)Rz(α)Ry(β)Rz−1(α)Rz(α)=Rz(α)Ry(β)Rz−1(α)Rz(γ)Rz(α)=Rz(α)Ry(β)Rz(γ)Rz−1(α)Rz(α)=Rz(α)Ry(β)Rz(γ)
这就将绕变更轴的转动转换成了绕固定轴的转动,但是转动的次序发生了变化。最终我们得到欧拉转动的简化计算式为
Rz′′(γ)Ry′(β)Rz(α)=Rz(α)Ry(β)Rz(γ)≡R(α,β,γ)
量子力学中的转动
希尔伯特空间中的诱导转动
和平移算符的引入相同,量子力学引入角动量理论的方式:三维空间中的每一个旋转 R,都能诱导出希尔伯特空间中的一个对应的幺正变换 D(R):
∣ψ⟩R=D(R)∣ψ⟩
其中 ∣ψ⟩R 和 ∣ψ⟩ 分别是转动后的系统和初始系统的右矢。此时 D(R) 还只是一个抽象的算符,无法确定其维数,因为我们还没确定表象,就像群表示论中有多个表示一样。D(R) 的矩阵表示(我们将在下文中详细讨论)取决于所讨论的特定右矢空间的维度。
波函数的转动
考虑一个无穷小转动 Rn^(ε),由于波函数是标量函数,那么应有
ψ′(x′)=ψ(x)
类比一下数学中平移前后的两个函数的关系,有
ψ′(x)=ψ(x−Δx)
利用泰勒展开,我们有
ψ′(x)=ψ(x)−Δx⋅∇ψ(x)=ψ(x)−ε(n^×x)⋅∇ψ(x)=ψ(x)−ε(n^×x)i∂iψ(x)=ψ(x)−εεijknjxk∂iψ(x)=ψ(x)−εnjεkijxk∂iψ(x)=ψ(x)−εnj(x×∇)jψ(x)=ψ(x)−ℏiεn⋅[x×(−iℏ∇)]ψ(x)
在坐标表象中,我们有
x^=x,p^=−iℏ∇
因此角动量算符为
L^=x^×p^=x×(−iℏ∇)
所以波函数在无穷小转动下的变换为
ψ′(x)=[1−ℏiεL^⋅n^]ψ(x)
角动量算符
我们与空间平移做对比
ψ′(x)=ψ(x−Δx)=ψ(x)−Δx⋅∇ψ(x)=(1−ℏip⋅Δx)ψ(x)
因为转动中的 n^ 与 x 有关(例如不同位置方向不同),而平移中的 Δx 与 x 无关,所以可以直接保留成 Δx 的形式。
和动量是平移的生成元一样,轨道角动量是转动的生成元。在抽象的态空间中定义 T(Δx)=e−ℏip⋅Δx,其对态矢的作用为 T(Δx)∣x⟩=∣x+Δx⟩,但若在薛定谔表象中表示该算符,则为 T^(Δx)=e−ℏip^⋅Δx,其对波函数的作用为 T^(Δx)ψ(x)=ψ(x−Δx)(因为平移算符作用在左矢上为负号),这两种表述是等价的。
与平移类似,对于转动来说,在态空间的转动为 e−ℏiL^⋅n^ε∣ψ⟩=∣ψ⟩R,而在薛定谔表象中表示该算符,则为 e−ℏiL^⋅n^εψ(x)=ψ(x−Δx)。
根据以上讨论,我们定义角动量算符 J :绕轴 n^ 旋转角度 dα 的无穷小旋转算符
Dn^(dα)=1−ℏi(J⋅n^)dα
这里定义的角动量算符 J 并不局限于轨道角动量 L=x×p,因为自旋角动量(这也适用于通用理论)与 x 和 p 无关。
再定义有限转动算符为
Dn^(α)=e−ℏiJ⋅n^α
| 三维空间中的转动 |
希尔伯特空间中的转动 |
| Rn^(α)=e−iαI⋅n^ |
Dn^(α)=e−ℏiJ⋅n^α |
| R3=R1R2 |
D(R3)=D(R1)D(R2) |
| [Rx^(ε),Ry^(ε)]=Rz^(ε2)−1 |
[Dx^(ε),Dy^(ε)]=Dz^(ε2)−1 |
| [Ii,Ij]=iεijkIk |
[Ji,Jj]=iℏεijkJk |
由于 D(R) 是由 R 诱导出来的,所以表格中的关系是一一对应的,区别在于希尔伯特空间中的生成元多了一个 ℏ 因子 I→ℏ1J。
表格中最后一行的对易关系和自旋角动量算符的对易关系完全相同,是角动量的基本对易关系
[Si,Sj]=iℏεijkSk
当无穷小变换的生成元不对易时,对应的操作群被称为非阿贝尔群。[Ji,Jj]=iℏεijkJk 表明三维转动群是非阿贝尔的。
在得出基本对易关系的过程中,我们使用了以下两个概念:
-
Jk 是绕第 k 轴旋转的生成元 (L^→J)
-
绕不同轴的旋转是不对易的 (I→ℏ1J)。
可以说,基本对易关系以一种紧凑的方式总结了三维转动的所有基本性质。下面我们将角动量算符写成一个列向量
J=JxJyJz=J1J2J3
注意,这里的 J 是算符而不是经典向量,所以不存在方向一说
平均值的转动
角动量算符的平均值定义为转动后的态上的 J 的平均值
⟨J⟩R≡R⟨ψ∣J∣ψ⟩R=⟨ψ∣D†(R)JD(R)∣ψ⟩=⟨ψ∣D†(R)JD(R)∣ψ⟩
根据 BCH 公式,可以计算出
eℏiJzαJxe−ℏiJzα=Jxcosα−JysinαeℏiJzαJye−ℏiJzα=Jxsinα+JycosαeℏiJzαJze−ℏiJzα=Jz
上式恰好对应于经典向量 Jx,Jy,Jz 绕 z^ 转动的结果。因此平均值中的蓝色下划线部分可形式地表示为经典转动(因为 J 不是经典向量而是算符)
Dz^†(α)JxJyJzDz^(α)=Jxcosα−JysinαJxsinα+JycosαJz=Rz^(α)JxJyJz
若我们计算转动后的算符平均值
⟨Jx⟩R⟨Jy⟩R⟨Jz⟩R=⟨Jx⟩cosα−⟨Jy⟩sinα⟨Jx⟩sinα+⟨Jy⟩cosα⟨Jz⟩=Rz^(α)⟨Jx⟩⟨Jy⟩⟨Jz⟩
在求平均值后,算符变为数值,此时是经典向量的转动形式。
总的来说,我们有
Dn^†(α)JDn^(α)=Rn^(α)J⟨J⟩R=Rn^(α)⟨J⟩
角动量算符的平均值 ⟨J⟩ 在转动下表现得就像经典向量一样。转动前后态的平均值之间由一个经典转动联系起来。如果一个算符的三个分量在转动下表现得像一个经典向量,那么我们就称这个算符是一个矢量算符 V(还有 x^ 和 p^)。
可以证明
Dn†(α)J2Dn(α)=J2
我们称在转动下不变的算符 J2 是一个标量算符。
J2 算符有一个很好的性质:它与三个分量都对易。
[J2,Jk]=0,(k=1,2,3)
对易的算符具有共同的本征态。且由于 J 的三个分量不对易,还有如下关系
(J×J)k=iℏJk⇒J×J=iℏJ
角动量的本征值和本征态
我们将会共同对角化 J2 和其中一个分量 Jz。整个角动量理论都源于基本对易关系 [Ji,Jj]=iℏεijkJk,这个关系是由三维转动的性质所决定的,因此要求该式对量子力学中任何动力学系统的角动量都必须成立。对易关系表明,J 的分量中只有一个能被对角化,我们通常选择 J3(或 Jz)来担任这一角色。
角动量算符的共同本征态
我们已知
[J2,Jk]=0,(k=1,2,3)
我们将选择 J2 和 J3 作为两个对易可观测量,对它们进行同时对角化。我们将这些共同本征右矢记为 ∣jm⟩,那么
J2∣jm⟩=j(j+1)ℏ2∣jm⟩J3∣jm⟩=mℏ∣jm⟩
至于为什么能直接写成这样,当然是事后诸葛亮啦
目前我们只知道 J2 和 J3 都是厄米算符,所以 j(j+1) 和 m 均为实数,且 j(j+1)≥0,因此有 j≥0 或 j≤−1,下面我们将关注 j≥0 这一支。
升降算符
和自旋角动量一样,我们定义角动量的升降算符,这两个非厄米算符在角动量理论中起着关键作用
J±≡J1±iJ2
它们互为厄米共轭
J±†=J∓
J1 和 J2 可由升降算符表示为
J1=2J++J−J2=2iJ+−J−
基于基本对易关系,可以得到升降算符的以下几个性质
-
对易关系:[J+,J−]=2ℏJ3,[J3,J±]=±ℏJ±
-
J12+J22=21(J+J−+J−J+)
-
J2=J12+J22+J32=J+J−−ℏJ3+J32=J−J++ℏJ3+J32=J±J∓∓ℏJ3+J32
m的上下界
利用性质3,我们在共同本征态上求 J+J− 的平均值
⟨jm∣J+J−∣jm⟩=⟨jm∣J2+ℏJ3−J32∣jm⟩=[j(j+1)+m−m2]ℏ2≥0
上式大于等于零的原因是改平均值可看作是 J−∣jm⟩ 的模平方。由于我们关注的是 j≥0 这一支,进一步有
j(j+1)≥m2−m⇒(j+21)2≥(m−21)2⇒j+21≥m−21⇒−j≤m≤j+1
类似地,在共同本征态上求 J−J+ 的平均值
⟨jm∣J−J+∣jm⟩=⟨jm∣J2−ℏJ3−J32∣jm⟩=[j(j+1)−m−m2]ℏ2≥0
同样能够得到 m 的另一个上下界
−j−1≤m≤j
综上所述,我们取交集得到 m 的最终上下界
−j≤m≤j
上式的等号只有在两个平均值为零 (J−∣jm⟩=0, J+∣jm⟩=0) 时成立,所以有
J−∣−jj⟩=0J+∣jj⟩=0
在给定 j 下 m 的取值
我们先结合升降算符的性质 1 证明
J3J±∣jm⟩=[J3,J±]∣jm⟩+J±J3∣jm⟩=±ℏJ±∣jm⟩+J±mℏ∣jm⟩=(m±1)ℏJ±∣jm⟩
即 J3 作用在 J±∣jm⟩ 态上的结果是将 m 变化 1:
J3(J±∣jm⟩)=(m±1)ℏ(J±∣jm⟩)
在给定 j 的情况下,我们可以在物理上逐步证明 m 的取值范围
-
j−1<mmax≤j
-
mmax=j
类似地,我们可以得到 mmin=−j。
在上一节我们只是证明了 m 处于 j 和 −j 之间: −j≤m≤j,但还没有证明 m 究竟能不能取到所有这些值。现在我们已经证明了 m 的最大值和最小值分别为 j 和 −j,接下来我们将证明在给定 j 的情况下,m 可以取到从 −j 到 j 之间的所有整数值
我们从最高态 ∣jj⟩ 开始,依次作用降算符 J−,每次作用都会使 m 减少 1,直到达到最低态 ∣−jj⟩
∣jj⟩:mJ−∣jj⟩:mJ−l∣jj⟩:m=j=j−1⋮=j−l⋮
由于每次 m 的变化量都是 1,且上下界要求 m 必须由 j 出发且终止于 −j,所以总的变化步数为 2j 且为整数,因此 j 必须是整数或半整数(自旋角动量量子数取半奇数,轨道角动量量子数取整数)
2j=integer⟹j=2integer
而在给定 j 的情况下,m 可以取到从 −j 到 j 之间的所有整数值
m=j,j−1,⋯,−j+1,−j
相比谐振子的升降算符,角动量的升降算符作用在最高态和最低态时会得到零态,而谐振子的升降算符作用在最高态时并不会得到零态,因为谐振子没有最高态。
总结
J2 和 J3 的共同本征态为
J2∣jm⟩=j(j+1)ℏ2∣jm⟩J3∣jm⟩=mℏ∣jm⟩
其中 j=0,21,1,23,⋯,而对于固定的 j,m 可以取 2j+1 个值:m=j,j−1,⋯,−j+1,−j
角动量的量子化(上两式)的根本来源是基本对易关系 [Ji,Jj]=iℏεijkJk ,而该对易关系本身又源自转动的性质和 Jk 为转动生成元
转动性质Jk 作为转动的生成元⟹[Ji,Jj]=iℏεijkJk⟹量子化的角动量
角动量算符的矩阵元
假设 {∣jm⟩} 是 正交归一的,即⟨j′m′∣jm⟩=δjj′δmm′,那么有
⟨j′m′∣J2∣jm⟩=j(j+1)ℏ2δjj′δmm′⟨j′m′∣J3∣jm⟩=mℏδjj′δmm′
接下来我们计算升降算符的矩阵元,我们已经推导了
J3(J±∣jm⟩)=(m±1)ℏ(J±∣jm⟩)⟹J±∣jm⟩=c±∣j,m±1⟩
再计算这个态的模方
⟨jm∣(J±)†J±∣jm⟩=⟨jm∣J∓J±∣jm⟩=⟨jm∣J2−J32∓ℏJ3∣jm⟩=[j(j+1)−m2∓m]ℏ2=[j(j+1)−m(m±1)]ℏ2
按照惯例,我们取 c± 为正实数,因此有
J±∣jm⟩=j(j+1)−m(m±1)ℏ∣j,m+1⟩
因式分解后还能写成
J±∣jm⟩=(j∓m)(j±m+1)ℏ∣j,m+1⟩
例如,在基 {∣1,1⟩,∣1,0⟩,∣1,−1⟩} 下,J3 是对角的
J3(1)≐ℏ10000000−1=ℏdiag(1,0,−1)
又由于
J2∣1,1⟩=2iJ4−J−∣1,1⟩=−2iJ−∣1,1⟩=2i(1+1)(1−1+1)ℏ∣1,0⟩=2iℏ∣1,0⟩J2∣1,−1⟩=2iJ+∣1,−1⟩=−2i[1−(−1)][1+(−1)+1]ℏ∣1,0⟩=−2iℏ∣1,0⟩
那么对这两式同时左乘其他左矢,就能得到 J2 的矩阵元
J2(1)≐2ℏ0i0???0−i0厄米性J2≐2ℏ0i0−i?i0−i0⟹J2(1)≐2ℏ0i0−i0i0−i0
同理可得 J1 的矩阵表示
J1(1)≐2ℏ010101010
J1(1) 和 J3(1) 是纯实数,而 J2(1) 是纯虚数。
量子生成元 J 和经典生成元 I 之间的关系
三维转动的生成元 Ii(3×3 矩阵):[Ii,Ij]=iεijkIk
j=1 角动量算符的矩阵表示(3×3 矩阵):[Ji(1)/ℏ,Jj(1)/ℏ]=iεijkJk(1)/ℏ
既然它们满足同样的对易关系,又都是 3×3 矩阵,所以我们猜测 Ji(1)/ℏ 和 Ii 通过一个 3×3 的幺正变换联系在一起。
我们可以找到一个幺正矩阵 W,使得 ℏJi(1)=WTIiW∗
W=21−1i00021i0
J分量的两个重要代数性质
定义 Dj 为由 {∣jm⟩} 张成的 2j+1 维复矢量空间
-
无迹性:TrJi(j)=0
-
在 Dj 中,角动量算符的任意函数都是最高次数为 2j 的多项式。也就是说,从 2j 次方开始,角动量算符就不独立了,可以用低次幂的多项式表示出来,例如 (ℏJi(1))3=ℏJi(1)。
半奇数 j 的 2pi 旋转
对于 j=2奇整数,我们有:Dz(j)(α+2π)=−Dz(j)(α),这意味着对于半奇数自旋,绕 z 轴旋转 2π后,态不会复原而是反号。
因为轨道量子数必须为整数,所以 j 的半整数只能来源于自旋量子数。
在 Dj 空间中,J3 是对角化的,那么 Dz(j)(α)=e−ℏiJ3(j)α 也是对角化的:
⟨jm′∣Dz^(α)∣jm⟩=⟨jm′∣e−ℏiJ3α∣jm⟩=e−imαδmm′
而 Dz^(α+2π) 的矩阵元为
⟨jm′∣Dz^(α+2π)∣jm⟩=e−im(α+2π)δmm′=e−im2π⟨jm′∣Dz^(α)∣jm⟩
当 j 为半奇数时,m 也只能是半奇数,所以
⟨jm′∣Dz^(α+2π)∣jm⟩=−⟨jm′∣Dz^(α)∣jm⟩
因此对于半奇数自旋,有
Dz^(j)(α+2π)=−Dz^(j)(α)
转 4π 后又会回到原来的态。
而对于整数自旋,显然有
Dz^(j)(α+2π)=Dz^(j)(α)
因此我们可以给出一种统一的形式
Di(j)(α+2π)=(−1)2jDi(j)(α),i=1,2,3
实验已经证实,中子具有双值波函数,这并不奇怪,因为波函数本身并不是可观测量,而是概率幅,概率幅取平方后负号抵消,不会改变平均值。