在经典力学中,角动量是不太重要的,但在量子力学中,角动量十分重要,为什么?在分子、原子和核光谱学中,对角动量的深入理解是必不可少的,角动量的考量在散射和碰撞问题以及束缚态问题中起着重要作用。此外,角动量概念还有重要的推广——例如核物理中的同位旋,粒子物理中的 SU(3)SU(3)SU(2)U(1)SU(2) \otimes U(1) 等等。

三维空间的经典转动

三维空间中的转动

一个转动 Rn^(α)R_{\hat{n}}(\alpha) 由以下两点确定:

  1. 沿转动轴的单位矢量 n^(θ,ϕ)\hat{n}(\theta, \phi)
  2. n^\hat{n} 旋转的角度 α[0,2π]\alpha \in [0, 2\pi]

这说明刻画三维空间中的转动需要三个实参数。下图所示的是一个绕 zz 轴旋转 α\alpha 的转动 Rz^(α)v=vR_{\hat{z}}(\alpha) \textcolor{orange}{v} = \textcolor{green}{v'} 及这个转动在 xyxy 平面上的投影。

绕z轴的转动及其投影

根据投影我们得到以下关系

vx=vxycos(θ+α)=vxy(cosθcosαsinθsinα)=vxcosαvysinαvy=vxysin(θ+α)=vxy(sinθcosα+cosθsinα)=vxsinα+vycosαvz=vz\begin{aligned} \textcolor{green}{v'_x} &= \textcolor{green}{|v'_{xy}| \cos(\theta + \alpha)} = \textcolor{orange}{|v_{xy}|} (\textcolor{orange}{\cos \theta} \cos \alpha - \textcolor{orange}{\sin \theta} \sin \alpha) = \textcolor{orange}{v_x} \cos \alpha - \textcolor{orange}{v_y} \sin \alpha \\[1em] \textcolor{green}{v'_y} &= \textcolor{green}{|v'_{xy}| \sin(\theta + \alpha)} = \textcolor{orange}{|v_{xy}|} (\textcolor{orange}{\sin \theta} \cos \alpha + \textcolor{orange}{\cos \theta} \sin \alpha) =\textcolor{orange}{v_x} \sin \alpha+ \textcolor{orange}{v_y} \cos \alpha \\[1em] \textcolor{green}{v'_z} &= \textcolor{orange}{v_z} \end{aligned}

我们可以将上面的关系写成矩阵形式

(vxvyvz)=(cosαsinα0sinαcosα0001)(vxvyvz)\textcolor{green}{\begin{pmatrix} v'_x \\ v'_y \\ v'_z \end{pmatrix}} = \begin{pmatrix} \cos \alpha & -\sin \alpha & 0 \\ \sin \alpha & \cos \alpha & 0 \\ 0 & 0 & 1 \end{pmatrix} \textcolor{orange}{\begin{pmatrix} v_x \\ v_y \\ v_z \end{pmatrix}}

那么这个三维转动矩阵为

Rz^(α)=(cosαsinα0sinαcosα0001)R_{\hat{z}}(\alpha) = \begin{pmatrix} \cos \alpha & -\sin \alpha & 0 \\ \sin \alpha & \cos \alpha & 0 \\ 0 & 0 & 1 \end{pmatrix}

类似地,我们可以得到绕 xx 轴和 yy 轴的转动矩阵

Rx^(α)=(1000cosαsinα0sinαcosα)Ry^(α)=(cosα0sinα010sinα0cosα)R_{\hat{x}}(\alpha) = \begin{pmatrix} 1 & 0 & 0 \\ 0 & \cos \alpha & -\sin \alpha \\ 0 & \sin \alpha & \cos \alpha \end{pmatrix} \quad \quad R_{\hat{y}}(\alpha) = \begin{pmatrix} \cos \alpha & 0 & \sin \alpha \\ 0 & 1 & 0 \\ -\sin \alpha & 0 & \cos \alpha \end{pmatrix}

注意绕 yy 轴转动的手性。

因为三个矩阵 Rx^(α),Ry^(α),Rz^(α)R_{\hat{x}}(\alpha), R_{\hat{y}}(\alpha), R_{\hat{z}}(\alpha) 能维持向量的模不变,所以它们都是实正交矩阵,且行列式均为 11,即它们都是 SO(3)\text{SO}(3) 群的元素。

无穷小转动

就像无穷小平移一样,我们会经常使用无限小转动。在一个无穷小转动下,

无穷小转动

变化的长度为弧长,方向也是切线方向,所以有

Δv=rε=vsinθεΔv=n^×vε|\Delta\boldsymbol{v}|=r\varepsilon=|\boldsymbol{v}|\sin\theta\varepsilon \quad \Rightarrow \quad \Delta\boldsymbol{v}=\hat{n}\times\boldsymbol{v}\varepsilon

在该旋转下,三维矢量 v\boldsymbol{v} 的变换形式(保留至 ε\varepsilon 的一阶项)为:

v=Rn^(ε)v=v+Δv=v+εn^×vv^{\prime}=R_{\hat{n}}(\varepsilon)v=v+\Delta v=v+\varepsilon\hat{n}\times v

我们分别在 Rx^(α),Ry^(α),Rz^(α)R_{\hat{x}}(\alpha), R_{\hat{y}}(\alpha), R_{\hat{z}}(\alpha) 中取无穷小转动的泰勒展开 cosε1,sinε=ε\cos\varepsilon\approx1,\sin\varepsilon=\varepsilon,那么

Rx^(ε)=(10001ε0ε1)Ry^(ε)=(10ε010ε01)Rz^(ε)=(1ε0ε10001)R_{\hat{x}}(\varepsilon)= \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & -\varepsilon \\ 0 & \varepsilon & 1 \end{pmatrix} \qquad R_{\hat{y}}(\varepsilon)= \begin{pmatrix} 1 & 0 & \varepsilon \\ 0 & 1 & 0 \\ -\varepsilon & 0 & 1 \end{pmatrix}\qquad R_{\hat{z}}(\varepsilon)= \begin{pmatrix} 1 & -\varepsilon & 0 \\ \varepsilon & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}

若定义三个纯虚矩阵

I1(00000i0i0)I2(00i000i00)I3(0i0i00000)I_1\equiv \begin{pmatrix} 0 & 0 & 0 \\ 0 & 0 & -i \\ 0 & i & 0 \end{pmatrix}\qquad I_2\equiv \begin{pmatrix} 0 & 0 & i \\ 0 & 0 & 0 \\ -i & 0 & 0 \end{pmatrix}\qquad I_3\equiv \begin{pmatrix} 0 & -i & 0 \\ i & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix}

那么我们可以将无穷小转动矩阵写成

Rχ^(ε)=1iεI1,Ry^(ε)=1iεI2,Rz^(ε)=1iεI3R_{\hat{\chi}}(\varepsilon)=1-i\varepsilon I_1,\quad R_{\hat{y}}(\varepsilon)=1-i\varepsilon I_2,\quad R_{\hat{z}}(\varepsilon)=1-i\varepsilon I_3

这三个 II 矩阵都是厄米矩阵,其实就是将 σy\sigma_y 嵌入到 3×33\times 3 矩阵中得到的。这三个矩阵就是 SO(3)\text{SO}(3) 群基本表示的无穷小生成元,和我们之前提到的幺正变换的生成元 FF 类似,只不过在这里是矩阵形式的。生成元具有以下性质:

  1. (Ii)jk=iεijk(I_i)_{jk}=-i\varepsilon_{ijk}

  2. [Ii,Ij]=iεijkIk\begin{bmatrix}I_i,I_j\end{bmatrix}=i\varepsilon_{ijk}I_k

    • 这似乎和自旋算符、泡利算符的对易关系相似?
    • 经典的三维转动和量子中自旋为 11 的转动之间只相差一个幺正变换
  3. I12=(000010001),I22=(100000001),I32=(100010000)I_1^2= \begin{pmatrix} 0 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix},I_2^2= \begin{pmatrix} 1 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix},I_3^2= \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{pmatrix}

    I2I12+I22+I32=2\boldsymbol{I}^2\equiv I_1^2+I_2^2+I_3^2=2

    我们知道,L2=l(l+1)2\boldsymbol{L}^2=l(l+1)\hbar^2(卡西米尔算符),所以三维空间的转动对应角动量量子数 l=1l=1

    可以看出 Ij3=IjI_j^3 = I_j,因此生成元的偶数次方都是平方 Ij2n=Ij2I_j^{2n} = I_j^2,奇数次方都是自身 Ij2n+1=IjI_j^{2n+1} = I_j

  4. eiαIj=1+Ij2(cosα1)+isinαIje^{i\alpha I_j}=1+I_j^2(\cos\alpha-1)+i\sin\alpha I_j

  5. 任意方向的无穷小转动可用生成元写为

    Rn^(ε)=1iεIn^R_{\hat{n}}(\varepsilon)=1-i\varepsilon\boldsymbol{I}\cdot\widehat{n}

    任意方向的有限转动可写为

    Rn^(α)=eiαIn^R_{\hat{n}}(\alpha)=e^{-i\alpha\boldsymbol{I}\cdot\widehat{n}}

    由于 IiI_i 是纯虚矩阵和厄米矩阵,所以 eiαIn^e^{-i\alpha\boldsymbol{I}\cdot\widehat{n}} 是一个实正交矩阵

不同轴转动之间的关系

  • 有限旋转:绕不同轴的有限旋转不对易
  • 无穷小旋转:当保留至二阶 ε2\varepsilon^2 项时,绕不同轴的转动不对易

考虑两个转轴 n^\hat{n}m^\hat{m},它们通过一个变换 R\mathcal{R} 相关联,即 n^=Rm^\hat{n}=\mathcal{R}\hat{m}。那么有

Rn^(α)=RRm^(α)R1R_{\hat{n}}(\alpha)=\mathcal{R}R_{\hat{m}}(\alpha)\mathcal{R}^{-1}

不同轴转动关系

Rm^(α)R1v=R1Rn^(α)vR_{\hat{m}}(\alpha)\mathcal{R}^{-1}\boldsymbol{v}=\mathcal{R}^{-1}R_{\hat{n}}(\alpha)\boldsymbol{v}

对上图,看作两个圆锥整体之间的变换更好理解

任意转轴 n^\hat{n} 可由 z^\hat{z} 轴变换得到

Rz^(ϕ)Ry^(θ)z^=n^R_{\hat{z}}(\phi)R_{\hat{y}}(\theta)\hat{z}=\hat{n}

任意转轴

此时 R=Rz^(ϕ)Ry^(θ)\mathcal{R}=R_{\hat{z}}(\phi)R_{\hat{y}}(\theta),所以绕任意轴 n^\hat{n} 可由绕 zz 轴的转动变换而来

Rn^(α)=Rz^(ϕ)Ry^(θ)Rz^(α)Ry^1(θ)Rz^1(ϕ)R_{\hat{n}}(\alpha)=R_{\hat{z}}(\phi)R_{\hat{y}}(\theta)R_{\hat{z}}(\alpha)R_{\hat{y}}^{-1}(\theta)R_{\hat{z}}^{-1}(\phi)

经典力学中的欧拉转动

欧拉转动将任意转动通过三步实现:Rz(γ)Ry(β)Rz(α)R_{z^{\prime\prime}}(\gamma)R_{y^{\prime}}(\beta)R_z(\alpha)

  1. zz 轴转动 α\alpha

  2. 绕新的 yy^{\prime} 轴转动 β\beta

  3. 绕新的 zz^{\prime\prime} 轴转动 γ\gamma

欧拉转动

从第二步开始,转动就沿着新的轴转动,我们需要找到这些新轴转动

y^=Rz(α)y^Ry(β)=Rz(α)Ry(β)Rz1(α)\hat{y}^{\prime}=R_z(\alpha)\hat{y}\quad \Rightarrow \quad R_{y^{\prime}}(\beta)=R_z(\alpha)R_y(\beta)R_z^{-1}(\alpha)

z^=Ry(β)z^Rz(γ)=Ry(β)Rz(γ)Ry1(β)\hat{z}^{\prime\prime}=R_{y^{\prime}}(\beta)\hat{z}\quad\Rightarrow\quad R_{z^{\prime\prime}}(\gamma)=R_{y^{\prime}}(\beta)R_z(\gamma)R_{y^{\prime}}^{-1}(\beta)

将上两式代入欧拉转动表达式中,得到

Rz(γ)Ry(β)Rz(α)=Rz(α)Ry(β)Rz1(α)Rz(γ)Rz(α)Ry1(β)Rz1(α)Rz(α)Ry(β)Rz1(α)Rz(α)=Rz(α)Ry(β)Rz1(α)Rz(γ)Rz(α)=Rz(α)Ry(β)Rz(γ)Rz1(α)Rz(α)=Rz(α)Ry(β)Rz(γ)\begin{aligned} & \textcolor{green}{R_{z^{\prime\prime}}(\gamma)} \textcolor{orange}{R_{y^{\prime}}(\beta)} R_z(\alpha) \\[1em] &= \textcolor{green}{R_z(\alpha)R_y(\beta)R_z^{-1}(\alpha)R_z(\gamma)R_z(\alpha)} \bcancel{\textcolor{green}{R_y^{-1}(\beta)R_z^{-1}(\alpha)}\textcolor{orange}{R_z(\alpha)R_y(\beta)}}\bcancel{\textcolor{orange}{R_z^{-1}(\alpha)}R_z(\alpha)} \\[1em] &= \textcolor{green}{R_z(\alpha)R_y(\beta)R_z^{-1}(\alpha)R_z(\gamma)R_z(\alpha)} = \textcolor{green}{R_z(\alpha)R_y(\beta)R_z(\gamma)}\bcancel{\textcolor{green}{R_z^{-1}(\alpha)R_z(\alpha)}} \\[1em] &= \textcolor{green}{R_z(\alpha)R_y(\beta)R_z(\gamma)} \end{aligned}

这就将绕变更轴的转动转换成了绕固定轴的转动,但是转动的次序发生了变化。最终我们得到欧拉转动的简化计算式为

Rz(γ)Ry(β)Rz(α)=Rz(α)Ry(β)Rz(γ)R(α,β,γ)\boxed{R_{z^{\prime\prime}}(\gamma)R_{y^{\prime}}(\beta)R_z(\alpha)=R_z(\alpha)R_y(\beta)R_z(\gamma)\equiv R(\alpha,\beta,\gamma)}

量子力学中的转动

希尔伯特空间中的诱导转动

和平移算符的引入相同,量子力学引入角动量理论的方式:三维空间中的每一个旋转 RR,都能诱导出希尔伯特空间中的一个对应的幺正变换 D(R)D(R)

ψR=D(R)ψ|\psi\rangle_R=D(R)|\psi\rangle

诱导转动

其中 ψR\ket{\psi}_Rψ\ket{\psi} 分别是转动后的系统和初始系统的右矢。此时 D(R)D(R) 还只是一个抽象的算符,无法确定其维数,因为我们还没确定表象,就像群表示论中有多个表示一样。D(R)D(R) 的矩阵表示(我们将在下文中详细讨论)取决于所讨论的特定右矢空间的维度。

波函数的转动

考虑一个无穷小转动 Rn^(ε)R_{\hat{n}}(\varepsilon),由于波函数是标量函数,那么应有

ψ(x)=ψ(x)\psi^{\prime}(x^{\prime})=\psi(x)

波函数 的转动

类比一下数学中平移前后的两个函数的关系,有

ψ(x)=ψ(xΔx)\psi^{\prime}(x)=\psi(x-\Delta x)

利用泰勒展开,我们有

ψ(x)=ψ(x)Δxψ(x)=ψ(x)ε(n^×x)ψ(x)=ψ(x)ε(n^×x)iiψ(x)=ψ(x)εεijknjxkiψ(x)=ψ(x)εnjεkijxkiψ(x)=ψ(x)εnj(x×)jψ(x)=ψ(x)iεn^[x×(i)]ψ(x)\begin{aligned} \psi^{\prime}(x) & =\psi(x)-\Delta x\cdot\nabla\psi(x) =\psi(x)-\varepsilon(\hat{n}\times x)\cdot\nabla\psi(x) \\[0.5em] & =\psi(x)-\varepsilon(\hat{n}\times x)_i\partial_i\psi(x) =\psi(x)-\varepsilon\varepsilon_{ijk}n_jx_k\partial_i\psi(x) \\[0.5em] & =\psi(x)-\varepsilon n_j\varepsilon_{kij}x_k\partial_i\psi(x) =\psi(x)-\varepsilon n_j(x\times\nabla)_j\psi(x) \\[0.5em] & =\psi(x)-\frac{i}{\hbar}\varepsilon\widehat{n}\cdot[x\times(-i\hbar\nabla)]\psi(x) \end{aligned}

在坐标表象中,我们有

x^=x,p^=i\hat{x}=x,\quad \hat{p}=-i\hbar\nabla

因此角动量算符为

L^=x^×p^=x×(i)\hat{L}= \hat{x}\times \hat{p} = x\times(-i\hbar\nabla)

所以波函数在无穷小转动下的变换为

ψ(x)=[1iεL^n^]ψ(x)\psi^{\prime}(x)=\left[1-\frac{i}{\hbar}\varepsilon\hat{L} \cdot \hat{n}\right]\psi(x)

角动量算符

我们与空间平移做对比

ψ(x)=ψ(xΔx)=ψ(x)Δxψ(x)=(1ip^Δx)ψ(x)\psi^{\prime}(x)=\psi(x-\Delta x)=\psi(x)-\Delta x\cdot\nabla\psi(x)=\left(1-\frac{i}{\hbar}\widehat{p}\cdot\Delta x\right)\psi(x)

波函数平移

因为转动中的 n^\hat{n}xx 有关(例如不同位置方向不同),而平移中的 Δx\Delta xxx 无关,所以可以直接保留成 Δx\Delta x 的形式。

和动量是平移的生成元一样,轨道角动量是转动的生成元。在抽象的态空间中定义 T(Δx)=eipΔxT(\Delta \boldsymbol{x})=e^{-\dfrac{i}{\hbar}p\cdot\Delta x},其对态矢的作用为 T(Δx)x=x+ΔxT(\Delta \boldsymbol{x})|\boldsymbol{x}\rangle=|\boldsymbol{x}+\Delta \boldsymbol{x}\rangle,但若在薛定谔表象中表示该算符,则为 T^(Δx)=eip^Δx\hat{T}(\Delta \boldsymbol{x})=e^{-\dfrac{i}{\hbar}\hat{p}\cdot\Delta x},其对波函数的作用为 T^(Δx)ψ(x)=ψ(xΔx)\hat{T}(\Delta \boldsymbol{x})\psi(x)=\psi(x-\Delta \boldsymbol{x})(因为平移算符作用在左矢上为负号),这两种表述是等价的。

与平移类似,对于转动来说,在态空间的转动为 eiL^n^εψ=ψRe^{-\dfrac{i}{\hbar}\hat{L}\cdot\hat{n}\varepsilon}\ket{\psi}=\ket{\psi}_R,而在薛定谔表象中表示该算符,则为 eiL^n^εψ(x)=ψ(xΔx)e^{-\dfrac{i}{\hbar}\hat{\boldsymbol{L}}\cdot\hat{n}\varepsilon} \psi(\boldsymbol{x})=\psi(\boldsymbol{x}-\Delta \boldsymbol{x})

根据以上讨论,我们定义角动量算符 J\boldsymbol{J} :绕轴 n^\hat{n} 旋转角度 dαd\alpha 的无穷小旋转算符

Dn^(dα)=1i(Jn^)dα\boxed{D_{\hat{n}}(d\alpha) = 1 - \frac{i}{\hbar} (\boldsymbol{J} \cdot \hat{n}) d\alpha}

这里定义的角动量算符 J\boldsymbol{J} 并不局限于轨道角动量 L=x×p\boldsymbol{L} = \boldsymbol{x} \times \boldsymbol{p},因为自旋角动量(这也适用于通用理论)与 x\boldsymbol{x}p\boldsymbol{p} 无关。

再定义有限转动算符为

Dn^(α)=eiJn^αD_{\hat{n}}(\alpha)=e^{-\frac{i}{\hbar}\boldsymbol{J}\cdot\hat{n}\alpha}

三维空间中的转动 希尔伯特空间中的转动
Rn^(α)=eiαIn^R_{\hat{n}}(\alpha) = e^{-i\alpha I\cdot\hat{n}} Dn^(α)=eiJn^αD_{\hat{n}}(\alpha) = e^{-\frac{i}{\hbar}\mathbf{J}\cdot\hat{n}\alpha}
R3=R1R2R_3 = R_1 R_2 D(R3)=D(R1)D(R2)D(R_3) = D(R_1)D(R_2)
[Rx^(ε),Ry^(ε)]=Rz^(ε2)1[R_{\hat{x}}(\varepsilon), R_{\hat{y}}(\varepsilon)] = R_{\hat{z}}(\varepsilon^2) - 1 [Dx^(ε),Dy^(ε)]=Dz^(ε2)1[D_{\hat{x}}(\varepsilon), D_{\hat{y}}(\varepsilon)] = D_{\hat{z}}(\varepsilon^2) - 1
[Ii,Ij]=iεijkIk[I_i, I_j] = i\varepsilon_{ijk}I_k [Ji,Jj]=iεijkJk[J_i, J_j] = i\hbar\varepsilon_{ijk}J_k

由于 D(R)D(R) 是由 RR 诱导出来的,所以表格中的关系是一一对应的,区别在于希尔伯特空间中的生成元多了一个 \hbar 因子 I1JI \to \dfrac{1}{\hbar}J

表格中最后一行的对易关系和自旋角动量算符的对易关系完全相同,是角动量的基本对易关系

[Si,Sj]=iεijkSk[S_i, S_j] = i\hbar\varepsilon_{ijk}S_k

当无穷小变换的生成元不对易时,对应的操作群被称为非阿贝尔群。[Ji,Jj]=iεijkJk[J_i, J_j] = i\hbar\varepsilon_{ijk}J_k 表明三维转动群是非阿贝尔的。

在得出基本对易关系的过程中,我们使用了以下两个概念:

  1. JkJ_k 是绕第 kk 轴旋转的生成元 (L^J\hat{\boldsymbol{L}} \to \boldsymbol{J})

  2. 绕不同轴的旋转是不对易的 (I1J\boldsymbol{I} \to \dfrac{1}{\hbar} \boldsymbol{J})。

可以说,基本对易关系以一种紧凑的方式总结了三维转动的所有基本性质。下面我们将角动量算符写成一个列向量

J=(JxJyJz)=(J1J2J3)\boldsymbol{J}= \begin{pmatrix} J_x \\[0.5em] J_y \\[0.5em] J_z \end{pmatrix}= \begin{pmatrix} J_1 \\[0.5em] J_2 \\[0.5em] J_3 \end{pmatrix}

注意,这里的 J\boldsymbol{J} 是算符而不是经典向量,所以不存在方向一说

平均值的转动

角动量算符的平均值定义为转动后的态上的 J\boldsymbol{J} 的平均值

JRRψJψR=ψD(R)JD(R)ψ=ψD(R)JD(R)ψ\begin{aligned} \langle \mathbf{J} \rangle_R &\equiv \textcolor{red}{_R \langle \psi |} \mathbf{J} \textcolor{red}{| \psi \rangle_R} = \textcolor{red}{\langle \psi | D^\dagger(R)} \mathbf{J} \textcolor{red}{D(R) | \psi \rangle} = \langle \psi | \textcolor{blue}{\underline{\textcolor{green}{D^\dagger(R) J D(R)}}} | \psi \rangle \end{aligned}

根据 BCH\text{BCH} 公式,可以计算出

eiJzαJxeiJzα=JxcosαJysinαeiJzαJyeiJzα=Jxsinα+JycosαeiJzαJzeiJzα=Jz\begin{aligned} &e^{\dfrac{i}{\hbar}J_z\alpha}J_xe^{-\dfrac{i}{\hbar}J_z\alpha}=J_x\cos\alpha-J_y\sin\alpha \\[0.5em] & e^{\dfrac{i}{\hbar}J_z\alpha}J_ye^{-\dfrac{i}{\hbar}J_z\alpha}=J_x\sin\alpha+J_y\cos\alpha \\[0.5em] & e^{\dfrac{i}{\hbar}J_z\alpha}J_ze^{-\dfrac{i}{\hbar}J_z\alpha}=J_z \end{aligned}

上式恰好对应于经典向量 Jx,Jy,JzJ_x,J_y,J_zz^\hat{z} 转动的结果。因此平均值中的蓝色下划线部分可形式地表示为经典转动(因为 J\boldsymbol{J} 不是经典向量而是算符)

Dz^(α)(JxJyJz)Dz^(α)=(JxcosαJysinαJxsinα+JycosαJz)=Rz^(α)(JxJyJz)D_{\hat{z}}^\dagger(\alpha) \begin{pmatrix} J_x \\[0.5em] J_y \\[0.5em] J_z \end{pmatrix}D_{\hat{z}}(\alpha)= \begin{pmatrix} J_x\cos\alpha -J_y\sin\alpha \\[0.5em] J_x\sin\alpha +J_y\cos\alpha \\[0.5em] J_z \end{pmatrix}=R_{\hat{z}}(\alpha) \begin{pmatrix} J_x \\[0.5em] J_y \\[0.5em] J_z \end{pmatrix}

若我们计算转动后的算符平均值

(JxRJyRJzR)=(JxcosαJysinαJxsinα+JycosαJz)=Rz^(α)(JxJyJz)\begin{pmatrix} \langle J_x\rangle_R \\[0.5em] \langle J_y\rangle_R \\[0.5em] \langle J_z\rangle_R \end{pmatrix}= \begin{pmatrix} \langle J_x\rangle\cos\alpha -\langle J_y\rangle\sin\alpha \\[0.5em] \langle J_x\rangle\sin\alpha +\langle J_y\rangle\cos\alpha \\[0.5em] \langle J_z\rangle \end{pmatrix}=R_{\hat{z}}(\alpha) \begin{pmatrix} \langle J_x\rangle \\[0.5em] \langle J_y\rangle \\[0.5em] \langle J_z\rangle \end{pmatrix}

在求平均值后,算符变为数值,此时是经典向量的转动形式。

总的来说,我们有

Dn^(α)JDn^(α)=Rn^(α)JJR=Rn^(α)J\boxed{\begin{aligned} &D_{\hat{n}}^\dagger(\alpha)\boldsymbol{J}D_{\hat{n}}(\alpha)=R_{\hat{n}}(\alpha)\boldsymbol{J} \\[1em] &\langle\boldsymbol{J}\rangle_R=R_{\hat{n}}(\alpha)\langle\boldsymbol{J}\rangle \end{aligned}}

角动量算符的平均值 J\langle \boldsymbol{J} \rangle 在转动下表现得就像经典向量一样。转动前后态的平均值之间由一个经典转动联系起来。如果一个算符的三个分量在转动下表现得像一个经典向量,那么我们就称这个算符是一个矢量算符 V\mathbf{V}(还有 x^\hat{x}p^\hat{p})。

可以证明

Dn^(α)J2Dn^(α)=J2D_{\widehat{n}}^\dagger(\alpha)\boldsymbol{J}^2D_{\widehat{n}}(\alpha)=\boldsymbol{J}^2

我们称在转动下不变的算符 J2\boldsymbol{J}^2 是一个标量算符。

J2\boldsymbol{J}^2 算符有一个很好的性质:它与三个分量都对易。

[J2,Jk]=0,(k=1,2,3)[\boldsymbol{J}^2,J_k]=0,(k=1,2,3)

对易的算符具有共同的本征态。且由于 J\boldsymbol{J} 的三个分量不对易,还有如下关系

(J×J)k=iJkJ×J=iJ(\boldsymbol{J}\times\boldsymbol{J})_k=i\hbar J_k \quad \Rightarrow \quad \boldsymbol{J}\times\boldsymbol{J}=i\hbar\boldsymbol{J}

角动量的本征值和本征态

我们将会共同对角化 J2\boldsymbol{J}^2 和其中一个分量 JzJ_z。整个角动量理论都源于基本对易关系 [Ji,Jj]=iεijkJk[J_i, J_j] = i\hbar\varepsilon_{ijk}J_k,这个关系是由三维转动的性质所决定的,因此要求该式对量子力学中任何动力学系统的角动量都必须成立。对易关系表明,J\boldsymbol{J} 的分量中只有一个能被对角化,我们通常选择 J3J_3(或 JzJ_z)来担任这一角色。

角动量算符的共同本征态

我们已知

[J2,Jk]=0,(k=1,2,3)[\boldsymbol{J}^2,J_k]=0,(k=1,2,3)

我们将选择 J2\boldsymbol{J}^2J3J_3 作为两个对易可观测量,对它们进行同时对角化。我们将这些共同本征右矢记为 jm|j m\rangle,那么

J2jm=j(j+1)2jmJ3jm=mjm\begin{aligned} & J^2|jm\rangle=j(j+1)\hbar^2|jm\rangle \\[0.5em] & J_3|jm\rangle=m\hbar|jm\rangle \end{aligned}

至于为什么能直接写成这样,当然是事后诸葛亮啦

目前我们只知道 J2\boldsymbol{J}^2J3J_3 都是厄米算符,所以 j(j+1)j(j+1)mm 均为实数,且 j(j+1)0j(j+1) \ge 0,因此有 j0j \ge 0j1j \le -1,下面我们将关注 j0j \ge 0 这一支。

升降算符

和自旋角动量一样,我们定义角动量的升降算符,这两个非厄米算符在角动量理论中起着关键作用

J±J1±iJ2J_\pm\equiv J_1\pm iJ_2

它们互为厄米共轭

J±=JJ_{\pm}^{\dagger}=J_{\mp}

J1J_1J2J_2 可由升降算符表示为

J1=J++J2J2=J+J2iJ_1=\frac{J_++J_-}{2} \qquad \qquad J_2=\frac{J_+-J_-}{2i}

基于基本对易关系,可以得到升降算符的以下几个性质

  1. 对易关系:[J+,J]=2J3,[J3,J±]=±J±[J_+,J_-]=2\hbar J_3 ,\quad [J_3,J_\pm]=\pm\hbar J_\pm

  2. J12+J22=12(J+J+JJ+)J_1^2+J_2^2=\dfrac{1}{2}(J_+J_-+J_-J_+)

  3. J2=J12+J22+J32=J+JJ3+J32=JJ++J3+J32=J±JJ3+J32J^2=J_1^2+J_2^2+J_3^2=J_+J_--\hbar J_3+J_3^2=J_-J_++\hbar J_3+J_3^2=J_\pm J_\mp\mp\hbar J_3+J_3^2

m的上下界

利用性质3,我们在共同本征态上求 J+JJ_{+}J_{-} 的平均值

jmJ+Jjm=jmJ2+J3J32jm=[j(j+1)+mm2]20\langle jm|J_+J_-|jm\rangle=\langle jm|\boldsymbol{J}^2+\hbar J_3-J_3^2|jm\rangle=[j(j+1)+m-m^2]\hbar^2\geq0

上式大于等于零的原因是改平均值可看作是 JjmJ_-|jm\rangle 的模平方。由于我们关注的是 j0j \ge 0 这一支,进一步有

j(j+1)m2m(j+12)2(m12)2j+12m12jmj+1j(j+1)\geq m^2-m \quad \Rightarrow \quad\left(j+\frac{1}{2}\right)^2\geq\left(m-\frac{1}{2}\right)^2\quad\Rightarrow\quad j+\frac{1}{2}\geq\left|m-\frac{1}{2}\right|\quad\Rightarrow\quad-j\leq m\leq j+1

类似地,在共同本征态上求 JJ+J_{-}J_{+} 的平均值

jmJJ+jm=jmJ2J3J32jm=[j(j+1)mm2]20\langle jm|J_-J_+|jm\rangle=\langle jm|\boldsymbol{J}^2-\hbar J_3-J_3^2|jm\rangle=[j(j+1)-m-m^2]\hbar^2\geq0

同样能够得到 mm 的另一个上下界

j1mj-j-1\leq m\leq j

综上所述,我们取交集得到 mm 的最终上下界

jmj-j\leq m\leq j

上式的等号只有在两个平均值为零 (Jjm=0, J+jm=0J_-|jm\rangle=0,\ J_+|jm\rangle=0) 时成立,所以有

Jjj=0J+jj=0J_-|-jj\rangle=0 \quad \quad J_+|jj\rangle=0

在给定 j 下 m 的取值

我们先结合升降算符的性质 1 证明

J3J±jm=[J3,J±]jm+J±J3jm=±J±jm+J±mjm=(m±1)J±jmJ_3J_\pm|jm\rangle=[J_3,J_\pm]|jm\rangle+J_\pm J_3|jm\rangle=\pm\hbar J_\pm|jm\rangle+J_\pm m\hbar|jm\rangle=(m\pm1)\hbar J_\pm|jm\rangle

J3J_3 作用在 J±jmJ_\pm|jm\rangle 态上的结果是将 mm 变化 11

J3(J±jm)=(m±1)(J±jm)J_3(J_\pm|jm\rangle)=(m\pm1)\hbar(J_\pm|jm\rangle)

在给定 jj 的情况下,我们可以在物理上逐步证明 mm 的取值范围

  1. j1<mmaxjj-1<m_{\text{max}}\le j

  2. mmax=jm_{\text{max}}=j

m的上下界

类似地,我们可以得到 mmin=jm_{\text{min}}=-j

在上一节我们只是证明了 mm 处于 jjj-j 之间: jmj-j \le m \le j,但还没有证明 mm 究竟能不能取到所有这些值。现在我们已经证明了 mm 的最大值和最小值分别为 jjj-j,接下来我们将证明在给定 jj 的情况下,mm 可以取到从 j-jjj 之间的所有整数值


我们从最高态 jj|jj\rangle 开始,依次作用降算符 JJ_-,每次作用都会使 mm 减少 11,直到达到最低态 jj|-jj\rangle

jj:m=jJjj:m=j1Jljj:m=jl\begin{aligned} |jj\rangle:m & =j \\[0.5em] J_-|jj\rangle:m & =j-1 \\ & \vdots \\ J_-^l|jj\rangle:m & =j-l \\ & \vdots \end{aligned}

l和m的取值

由于每次 mm 的变化量都是 11,且上下界要求 mm 必须由 jj 出发且终止于 j-j,所以总的变化步数为 2j2j 且为整数,因此 jj 必须是整数或半整数(自旋角动量量子数取半奇数,轨道角动量量子数取整数)

2j=integerj=integer22j=\mathrm{integer}\quad\Longrightarrow\quad j=\frac{\mathrm{integer}}{2}

而在给定 jj 的情况下,mm 可以取到从 j-jjj 之间的所有整数值

m=j,j1,,j+1,jm=j,j-1,\cdots,-j+1,-j

相比谐振子的升降算符,角动量的升降算符作用在最高态和最低态时会得到零态,而谐振子的升降算符作用在最高态时并不会得到零态,因为谐振子没有最高态。


总结

J2\boldsymbol{J}^2J3J_3 的共同本征态为

J2jm=j(j+1)2jmJ3jm=mjmJ^2|jm\rangle=j(j+1)\hbar^2|jm\rangle \\[1em] J_3|jm\rangle=m\hbar|jm\rangle

其中 j=0,12,1,32,j=0,\dfrac{1}{2},1,\dfrac{3}{2},\cdots,而对于固定的 jjmm 可以取 2j+12j+1 个值:m=j,j1,,j+1,jm=j,j-1,\cdots,-j+1,-j

角动量的量子化(上两式)的根本来源是基本对易关系 [Ji,Jj]=iεijkJk[J_i, J_j] = i\hbar\varepsilon_{ijk}J_k ,而该对易关系本身又源自转动的性质和 JkJ_k 为转动生成元

转动性质Jk 作为转动的生成元[Ji,Jj]=iεijkJk量子化的角动量\boxed{ \begin{array} {c}\text{转动性质} \\ \\ J_k\text{ 作为转动的生成元} \end{array}}\quad \Longrightarrow\quad[J_i,J_j]=i\hbar\varepsilon_{ijk}J_k\quad\Longrightarrow\quad \begin{array} {c}\text{量子化的} \text{角动量} \end{array}

角动量算符的矩阵元

假设 {jm}\{|jm\rangle\} 是 正交归一的,即jmjm=δjjδmm\langle j^{\prime}m^{\prime}|jm\rangle=\delta_{jj^{\prime}}\delta_{mm^{\prime}},那么有

jmJ2jm=j(j+1)2δjjδmmjmJ3jm=mδjjδmm\begin{aligned} & \langle j^{\prime}m^{\prime}|J^2|jm\rangle=j(j+1)\hbar^2\delta_{jj^{\prime}}\delta_{mm^{\prime}} \\[1em] & \langle j^{\prime}m^{\prime}|J_3|jm\rangle=m\hbar\delta_{jj^{\prime}}\delta_{mm^{\prime}} \end{aligned}

接下来我们计算升降算符的矩阵元,我们已经推导了

J3(J±jm)=(m±1)(J±jm)J±jm=c±j,m±1J_3(J_\pm|jm\rangle)=(m\pm1)\hbar(J_\pm|jm\rangle)\quad \Longrightarrow \quad J_\pm|jm\rangle=c_\pm|j,m\pm1\rangle

再计算这个态的模方

jm(J±)J±jm=jmJJ±jm=jmJ2J32J3jm=[j(j+1)m2m]2=[j(j+1)m(m±1)]2\begin{aligned} \langle jm|(J_{\pm})^{\dagger}J_{\pm}|jm\rangle&=\langle jm|J_{\mp}J_{\pm}|jm\rangle=\langle jm|J^{2}-J_{3}^{2}\mp\hbar J_{3}|jm\rangle \\[1em] &=[j(j+1)-m^2\mp m]\hbar^2=[j(j+1)-m(m\pm1)]\hbar^2 \end{aligned}

按照惯例,我们取 c±c_{\pm} 为正实数,因此有

J±jm=j(j+1)m(m±1)j,m+1J_\pm|jm\rangle=\sqrt{j(j+1)-m(m\pm1)}\hbar|j,m+1\rangle

因式分解后还能写成

J±jm=(jm)(j±m+1)j,m+1J_\pm|jm\rangle=\sqrt{(j\mp m)(j\pm m+1)}\hbar|j,m+1\rangle


例如,在基 {1,1,1,0,1,1}\left\{|1,1\rangle,|1,0\rangle,|1,-1\rangle\right\} 下,J3J_3 是对角的

J3(1)(100000001)=diag(1,0,1)J_3^{(1)}\doteq\hbar \begin{pmatrix} 1 & 0 & 0 \\[0.5em] 0 & 0 & 0 \\[0.5em] 0 & 0 & -1 \end{pmatrix}=\hbar\operatorname{diag}(1,0,-1)

又由于

J21,1=J4J2i1,1=J2i1,1=i2(1+1)(11+1)1,0=i21,0J21,1=J+2i1,1=i2[1(1)][1+(1)+1]1,0=i21,0J_{2}|1,1\rangle=\frac{J_{4}-J_{-}}{2i}|1,1\rangle=-\frac{J_{-}}{2i}|1,1\rangle=\frac{i}{2}\sqrt{(1+1)(1-1+1)}\hbar|1,0\rangle=\frac{i\hbar}{\sqrt{2}}|1,0\rangle \\[1em] J_{2}|1,-1\rangle=\frac{J_{+}}{2i}|1,-1\rangle=-\frac{i}{2}\sqrt{[1-(-1)][1+(-1)+1]}\hbar|1,0\rangle=-\frac{i\hbar}{\sqrt{2}}|1,0\rangle

那么对这两式同时左乘其他左矢,就能得到 J2J_2 的矩阵元

J2(1)2(0?0i?i0?0)厄米性J22(0i0i?i0i0)J2(1)2(0i0i0i0i0)J_2^{(1)}\doteq\frac{\hbar}{\sqrt{2}} \begin{pmatrix} 0 & ? & 0 \\[0.5em] i & ? & -i \\[0.5em] 0 & ? & 0 \end{pmatrix}\quad \xRightarrow{\text{厄米性}}\quad J_2\doteq\frac{\hbar}{\sqrt{2}} \begin{pmatrix} 0 & -i & 0 \\[0.5em] i & ? & -i \\[0.5em] 0 & i & 0 \end{pmatrix}\quad \Longrightarrow \quad J_2^{(1)}\doteq\frac{\hbar}{\sqrt{2}} \begin{pmatrix} 0 & -i & 0 \\[0.5em] i & 0 & -i \\[0.5em] 0 & i & 0 \end{pmatrix}

同理可得 J1J_1 的矩阵表示

J1(1)2(010101010)J_1^{(1)}\doteq\frac{\hbar}{\sqrt2} \begin{pmatrix} 0 & 1 & 0 \\[0.5em] 1 & 0 & 1 \\[0.5em] 0 & 1 & 0 \end{pmatrix}

J1(1)J_1^{(1)}J3(1)J_3^{(1)} 是纯实数,而 J2(1)J_2^{(1)} 是纯虚数。

量子生成元 J 和经典生成元 I 之间的关系

三维转动的生成元 IiI_i3×33 \times 3 矩阵):[Ii,Ij]=iεijkIk[I_i, I_j] = i\varepsilon_{ijk} I_k
j=1j=1 角动量算符的矩阵表示(3×33 \times 3 矩阵):[Ji(1)/,Jj(1)/]=iεijkJk(1)/[J_i^{(1)}/\hbar, J_j^{(1)}/\hbar] = i\varepsilon_{ijk} J_k^{(1)}/\hbar

既然它们满足同样的对易关系,又都是 3×33 \times 3 矩阵,所以我们猜测 Ji(1)/J_i^{(1)}/\hbarIiI_i 通过一个 3×33 \times 3 的幺正变换联系在一起。

我们可以找到一个幺正矩阵 WW,使得 Ji(1)=WTIiW\dfrac{J_i^{(1)}}{\hbar}=W^TI_iW^*

W=12(101i0i020)W=\frac{1}{\sqrt2} \begin{pmatrix} -1 & 0 & 1 \\[0.5em] i & 0 & i \\[0.5em] 0 & \sqrt2 & 0 \end{pmatrix}

J分量的两个重要代数性质

定义 Dj\mathcal{D}_j 为由 {jm}\{ |jm\rangle \} 张成的 2j+12j + 1 维复矢量空间

  1. 无迹性:TrJi(j)=0\mathrm{Tr}J_i^{(j)}=0

  2. Dj\mathcal{D}_j 中,角动量算符的任意函数都是最高次数为 2j2j 的多项式。也就是说,从 2j2j 次方开始,角动量算符就不独立了,可以用低次幂的多项式表示出来,例如 (Ji(1))3=Ji(1)\left(\dfrac{J_i^{(1)}}{\hbar}\right)^3=\dfrac{J_i^{(1)}}{\hbar}

半奇数 j 的 2pi 旋转

对于 j=奇整数2j = \dfrac{\text{奇整数}}{2},我们有:Dz(j)(α+2π)=Dz(j)(α)D_z^{(j)}(\alpha + 2\pi) = -D_z^{(j)}(\alpha),这意味着对于半奇数自旋,绕 zz 轴旋转 2π2\pi后,态不会复原而是反号。

因为轨道量子数必须为整数,所以 jj 的半整数只能来源于自旋量子数。

Dj\mathcal{D}_j 空间中,J3J_3 是对角化的,那么 Dz(j)(α)=eiJ3(j)αD_z^{(j)}(\alpha) = e^{-\frac{i}{\hbar}J_3^{(j)}\alpha} 也是对角化的:

jmDz^(α)jm=jmeiJ3αjm=eimαδmm\langle jm' | D_{\hat{z}}(\alpha) | jm \rangle = \langle jm' | e^{-\frac{i}{\hbar} J_3 \alpha} | jm \rangle = e^{-im\alpha} \delta_{mm'}

Dz^(α+2π)D_{\hat{z}}(\alpha + 2\pi) 的矩阵元为

jmDz^(α+2π)jm=eim(α+2π)δmm=eim2πjmDz^(α)jm\langle j m' | D_{\hat{z}}(\alpha + 2\pi) | j m \rangle = e^{-im(\alpha + 2\pi)} \delta_{mm'} = \textcolor{green}{e^{-im2\pi}} \langle j m' | D_{\hat{z}}(\alpha) | j m \rangle

jj 为半奇数时,mm 也只能是半奇数,所以

jmDz^(α+2π)jm=jmDz^(α)jm\langle j m' | D_{\hat{z}}(\alpha + 2\pi) | j m \rangle = \textcolor{green}{-}\langle j m' | D_{\hat{z}}(\alpha) | j m \rangle

因此对于半奇数自旋,有

Dz^(j)(α+2π)=Dz^(j)(α)D_{\hat{z}}^{(j)}(\alpha+2\pi)=-D_{\hat{z}}^{(j)}(\alpha)

4π4\pi 后又会回到原来的态。

而对于整数自旋,显然有

Dz^(j)(α+2π)=Dz^(j)(α)D_{\hat{z}}^{(j)}(\alpha+2\pi)=D_{\hat{z}}^{(j)}(\alpha)

因此我们可以给出一种统一的形式

Di(j)(α+2π)=(1)2jDi(j)(α),i=1,2,3D_i^{(j)}(\alpha+2\pi)=(-1)^{2j}D_i^{(j)}(\alpha),\qquad i=1,2,3

实验已经证实,中子具有双值波函数,这并不奇怪,因为波函数本身并不是可观测量,而是概率幅,概率幅取平方后负号抵消,不会改变平均值。