特殊相対論

ローレンツ変換

光速度不変の原理は経験的な直感とは相容れないもので、この原理が見出された歴史的な過程もそれ自体面白くはありますが、今回はそういった議論を全て省いてこれを出発点とします。
光速不変の原理とは、慣性系によって光の速度が変わらないという原理のことです。ゆえに、X系の座標xとX‘系の座標x’の間に

\begin{align}
c^{2}dt^{2}-dx^{2}-dy^{2}-dz^{2}
\end{align}

=c^{2}dt'^{2}-dx'^{2}-dy'^{2}-dz'^{2}\tag{1}

が成立します。
さていま、X’系は、X系に対して、x軸方向に速度vで進んでいるとします。これに対するガリレイ変換は

 (t’,x’,y’,z’)=(t,x-vt,y,z)

なわけですが、これは光速度不変の原理を満たしていません(式(1)を満たさない)。
ではいかに改良すべきか?
dy'=dy,dz'=dz
という仮定はひとまず維持すると、式(1)は
c^{2}dt'^{2}-dx'^{2}
=c^{2}dt^{2}-dx^{2} \tag{2}
となるので、これを満たすような座標変換を求めればよいことになります。

直交座標の変換は線形なので、適当な係数を用いて

t'=At+Bx,  x'=Dx+Et

と書けるはずです。これを式(2)に入れて、 x^{2},xt,t^{2}の係数を見比べれば式が3つ出ますが、一方いま未知数はA,B,D,Eの4つです。足りないのは、当然X\rightarrow X^{\prime}という座標変換を特徴付ける速度vですね。X 系でX^{\prime}系の原点をみればx=vtですが、X^{\prime}系ではこれはx^{\prime}=0を意味しますから、座標変換でx-vt=0 \rightarrow x'=0と変換しなくてはいけません。これを適当に定数倍すれば

x'=D(x-vt)

と書けそうです。これで、未知数が3つに減ったので、全ての係数を求めることができます。

すると、結局座標変換は

\begin{cases}
t'=\dfrac {t-\dfrac {v}{c^{2}}x}{\sqrt {1-\left( \frac {v}{c}\right) ^{2}}}\\
\\
x'=\displaystyle \frac{x-vt}{\sqrt {1-\left( \frac {v}{c}\right) ^{2}}}
\end{cases}

という形をしていることが導かれました!これをローレンツ変換といいます。

そしてこれは、座標間の速度vが光速cに比べ十分小さいときには

\begin{cases}
x'=\displaystyle \frac{x-vt}{\sqrt {1-\left( \frac {v}{c}\right) ^{2}}}\approx x-vt\\
\\
t'=\dfrac {t-\dfrac {v}{c^{2}}x}{\sqrt {1-\left( \frac {v}{c}\right) ^{2}}}\approx t
\end{cases}

となり、ガリレイ変換を再現します。つまり、この世界で本当に正しいのはローレンツ変換であるものの、これまでは座標間の速度が小さかったので、ガリレイ変換で事足りていたというです。

相対性原理

ミンコフスキー空間

光速不変の原理を満たすような座標変換は、3次元空間でのガリレイ変換(x,y,z)→(x',y',z')ではなく、4次元時空でのローレンツ変換(ct,x,y,z)→(ct',x',y',z')であることが分かりました。そこで、(ct,x,y,z)という4次元の空間を考えてみるのは自然でしょう((x,y,z)と次元を合わせるため、時間座標をtでなくctとした)。この4次元時空をミンコフスキー空間という。
さて、このような新しい空間に対して、手始めに距離の公式を考えてみます。
素朴な発想では、原点から(cdt,dx,dy,dz)だけ離れた点までの距離dsは、ユークリッド空間にならって

 ds^{2}=c^{2}dt^{2}+dx^{2}+dy^{2}+dz^{2}

でよいのではないかと思いますが、実はこれはボツです。なぜかというと、見る座標系によって距離が変わってしまうからですね(ローレンツ不変でないということ)。相対論の本質とは、どこまでいっても座標変換での不変性!
思い出してみれば、ユークリッド空間での距離はガリレイ変換で不変なのでした:

dx^{\prime 2}+dy^{\prime 2}+dz^{\prime 2}=dx^{2}+dy^{2}+dz^{2}

たしかにこれはガリレイ不変ではあるが、当然ローレンツ不変ではない。ミンコフスキ時空では、ローレンツ変換に対して不変になるように距離の公式を定めるべきです。
ではどうすればローレンツ不変な距離公式が定められるのか?そこで便利なのが固有時という概念です:
X^{\prime}系の原点に粒子がありそこに静止しているとする。このような系を粒子の静止系といい、この静止系における時間座標のことを(粒子の)固有時といって\tauで表します。ローレンツ変換の式に従えば、いまdx=vdtだから、
 cd\tau=\displaystyle\frac{-\beta dx}{\sqrt{1-\beta^{2}}}
=\displaystyle\frac{\beta^{2}dt}{\sqrt{1-\beta^{2}}}=\sqrt{c^{2}dt^{2}-dx^{2}}

ゆえに

c^{2}d\tau^{2}

=c^{2}dt^{2}-dx^{2}

=c^{2}dt'^{2}-dx'^{2}

これはローレンツ変換で不変な値となっている。なのでこれをミンコフスキ空間の距離の公式とすれば良さそうです。いまはdy=dz=dy^{\prime}=dz^{\prime}としていましたが、そうではない場合にはそうではない場合には

c^{2}d\tau^{2}

=c^{2}dt^{2}-dx^{2}-dy^{2}-dz^{2}

=c^{2}dt'^{2}-dx^{\prime 2}-dy^{\prime 2}-dz^{\prime 2}

とすればいいです。

そもそもローレンツ変換というのは、光速度不変の原理から要請されたものであったから、上のような形をしていることは至極真っ当(本稿冒頭の式を参照)。

テンソル

特殊相対論での数学といえばテンソルですが、これは相対性原理と相性の良い道具です。そこでその性質と計算を簡単に述べます。以降、(x^{0},x^{1},x^{2},x^{3})=(ct,x,y,z)という書き方をします。こうすると、たとえば ds^{2}=(dx^{0})^{2}-(dx^{1})^{2}-(dx^{2})^{2}-(dx^{3})^{2}= (dx^{0})^{2}-\sum_{i=1}^{3} (dx^{i})^{2} と書けて便利です。

さてここで、(dx^{0},dx^{1},dx^{2},dx^{3})だけ離れた二つの世界点の間のベクトルを

\boldsymbol{x}=\sum_{\mu=0}^{3}dx^{\mu}\boldsymbol{e}_{\mu}

というふうに表してみる。本稿ではアルファベットの添字は1,2,3を走り、ギリシャ文字の添字は0,1,2,3を走ることにします。 さて、同一のベクトルを異なる座標系で見ても、同じものを見ているのだから

d\boldsymbol{x}\prime=d\boldsymbol{x}

となるはずです。しかしそれでも、成分dx^{\mu}と基底ベクトル\boldsymbol{e}_{\mu}はそれぞれ座標変換で変わる。 基底ベクトルは

\boldsymbol{e}_{\mu}=\displaystyle\frac{\partial \boldsymbol{x}}{\partial x^{\mu}}

と表せるから、偏微分の連鎖律より、

\boldsymbol{e}_{\mu}^{\prime}=\displaystyle\frac{\partial x^{\nu}}{\partial x^{\prime\mu}}\boldsymbol{e}_{\nu}

と変換します。この座標変換を逆に見れば、当然

\boldsymbol{e}_{\mu}=\displaystyle\frac{\partial x^{\prime\nu}}{\partial x^{\mu}}\boldsymbol{e}_{\nu}^{\prime}

も成り立っていて、これと式(15)から

 dx^{\prime\mu}=\displaystyle\frac{\partial x^{\prime\mu}}{\partial x^{\nu}}dx^{\nu}

という変換則もわかります。この二つの変換則に従う量はベクトルと呼ばれます、一方ds^{2}のようにどの座標系で見ても値の変わらない量をスカラーといいます。上の式を用いると

ds^{2}=d\boldsymbol{x}\cdot d\boldsymbol{x}=\sum_{\mu=0}^{3} \sum_{\nu=0}^{3}\boldsymbol{e}_{\mu}\cdot\boldsymbol{e}_{\nu}dx^{\mu}dx^{\nu}

これと先の式を比べると、

\boldsymbol{e}_{\mu}\cdot\boldsymbol{e}_{\nu}= \begin{cases} 1 & (\mu=\nu=0)\\ -1 & (\mu=\nu=1,2,3)\\ 0 & それ以外 \end{cases}

となってます。そこで、計量テンソルと呼ばれる次のような量を定義しましょう。

g_{\mu\nu}=\boldsymbol{e}_{\mu}\cdot\boldsymbol{e}_{\nu}

これがベクトルとベクトルの内積を決めるため、計量と呼ばれます。実は一般相対論を学ぶと、この計量が重力のポテンシャルとしての意味を担うことが分かります。

さて、座標変換の際の種々の変換則を書くと

 {\partial_{\mu}}'=\displaystyle\frac{\partial x^{\nu}}{\partial x'^{\mu}}\partial_{\nu} \boldsymbol{e}'_{\mu}=\displaystyle\frac{\partial x^{\nu}}{\partial x'^{\mu}}\boldsymbol{e}_{\nu} dx'^{\mu}=\displaystyle\frac{\partial x'^{\mu}}{\partial x^{\nu}}dx^{\nu}

というように変換しますね。上二つと下一つは互いに異なった変換をしているので、それぞれ共変、反変と呼んで両者を区別します。 ではなぜ、反変と共変という二つの変換則があるのか?

g'_{\mu\nu}= \displaystyle\frac{\partial x^{\alpha}}{\partial x'^{\mu}} \displaystyle\frac{\partial x^{\beta}}{\partial x'^{\nu}}g_{\alpha\beta}

テンソルの何が嬉しいか、何がすごいのか

テンソルというのは添字がいくつもあって複雑な量にも見えますが、なぜこんなものを考えるのか。実はこのテンソルを使うと、相対性原理を満たすように方程式を書くことができます。その際に先の変換則が重要な役割を果たします。たとえばいま、ある座標系xで、なんらかの方程式を A_{\mu\nu}=B_{\mu\nu} というテンソル方程式で書けたとします。これは運動方程式でもマクスウェル方程式でもなんでもいいんですが、とにかく両辺がテンソルで書かれている。 さてこの式は C_{\mu\nu}=A_{\mu\nu}-B_{\mu\nu}=0 という形にも書ける。 実はもうこの時点で、相対性原理が成立するのはほとんど自明になっているんです。というのは、いま別の座標系x'でのこのテンソルC'_{\mu\nu} とすれば、テンソルの変換則より

C_{\mu\nu}^{\prime}=\displaystyle\frac{\partial x^{\alpha}}{\partial x^{\prime\mu}}\displaystyle\frac{\partial x^{\beta}}{\partial x^{\prime\nu}}C_{\alpha\beta}

となりますが、x系ではC_{\mu\nu}は全成分ゼロなのだから、それをいくら足し合わせてもゼロである。つまり C_{\mu\nu}^{\prime}=0 がほとんど自動的に成り立ちます。これを先のX系での式と比べてみれば、全く同じ形で方程式が成立していることが一目瞭然となっています。これがテンソル算法の威力です。

ではテンソルをつかった具体例として、古典電磁気学を考えてみます(ここを読み飛ばしても、それ以降を読み進めるのに問題はない)。

電磁気学の方程式をテンソルで書いてみる

マクスウェル方程式や、ローレンツ力の式は、テンソルで書くとどのようになるのか?
まずマクスウェル方程式のうち、

\nabla \cdot \boldsymbol{B}=0

\nabla \times \boldsymbol{E}+\displaystyle\frac{\partial \boldsymbol{B}}{\partial t}=\boldsymbol{0}

テンソル形式で書き直します。これにはスカラーポテンシャルとベクトルポテンシャルを用いると便利です。

A^{0}=\displaystyle\frac{\phi}{c}

とすれば、


\boldsymbol{B}=\nabla \times \boldsymbol{A}

=\begin{pmatrix}
\partial_{2}A^{3}-\partial_{3}A^{2}\\
\partial_{3}A^{1}-\partial_{1}A^{3}\\
\partial_{1}A^{2}-\partial_{2}A^{1}
\end{pmatrix}

\begin{pmatrix}
\partial_{3}A_{2}-\partial_{2}A_{3}\\
\partial_{1}A_{3}-\partial_{3}A_{1}\\
\partial_{2}A_{1}-\partial_{1}A_{2}\\
\end{pmatrix}

\boldsymbol{E}=-\nabla\phi-\displaystyle\frac{\partial \boldsymbol{A}}{\partial t}

=-c\begin{pmatrix}
\partial_{1}A^{0}+\partial_{0}A^{1}\\
\partial_{2}A^{0}+\partial_{0}A^{2}\\
\partial_{3}A^{0}+\partial_{0}A^{3}
\end{pmatrix}

= c\begin{pmatrix}
\partial_{0}A_{1}-\partial_{1}A_{0}\\
\partial_{0}A_{2}-\partial_{2}A_{0}\\
\partial_{0}A_{3}-\partial_{3}A_{0}\\
\end{pmatrix}

と書ける。両者似た形をしていますから、

F_{\mu\nu}=\partial_{\mu}A_{\nu}-\partial_{\nu}A_{\mu}

という量を導入すると

\boldsymbol{B}
=\begin{pmatrix}
F_{32}\\
F_{13}\\
F_{21}
\end{pmatrix}

\boldsymbol{E}=c\begin{pmatrix}
F_{01}\\
F_{02}\\
F_{03}
\end{pmatrix}

であり、定義より、F_{\mu\nu}=-F_{\mu\nu}であることがすぐわかるから、

F_{\mu\nu}=\begin{pmatrix}
F_{00}&F_{01}&F_{02}&F_{03}\\
F_{10}&F_{11}&F_{12}&F_{13}\\
F_{20}&F_{21}&F_{22}&F_{23}\\
F_{30}&F_{31}&F_{32}&F_{33}\\
\end{pmatrix}

F_{\mu\nu}=\begin{pmatrix}
0&E^{1}/c& E^{2}/c& E^{3}/c\\
\text{-}E^{1}/c&0&-B^{3}&B^{2}\\
\text{-}E^{2}/c&B^{3}&0&-B^{1}\\
\text{-}E^{3}/c&-B^{2}&B^{1}&0
\end{pmatrix}

ちなみに、添字を上げると

F^{\mu\nu}=\begin{pmatrix}
0&-E^{1}/c& -E^{2}/c& -E^{3}/c\\
E^{1}/c&0&-B^{3}&B^{2}\\
E^{2}/c&B^{3}&0&-B^{1}\\
E^{3}/c&-B^{2}&B^{1}&0
\end{pmatrix}

こうして、電場と磁場は2階のテンソルになることがわかった(ベクトルではない!)。この時点で、先の二式はすでに満たされている。
残りの二式は

\nabla \cdot \boldsymbol{E}=\displaystyle\frac{\rho}{\epsilon_{0}}

\nabla \times \boldsymbol{B}-\displaystyle\frac {1} {c^{2}}\displaystyle\frac{\partial \boldsymbol{E}}{\partial t}=\mu_{0}\boldsymbol{i}

これらをfを用いて書き直すと、それぞれ

\partial _{i}F^{i0}=\mu _{0}\rho c

\partial _{i}F^{ik}=\mu _{0}i^{k}

となるので、j^{\nu}=(\rho c,j^{1},j^{2},j^{3})とすれば、

\partial_{\mu}F^{\mu\nu}=\mu_{0}j^{\nu}

というふうに書ける。
最後は運動方程式(ローレンツ力の式)。

m\ddot{\boldsymbol{r}}=e\boldsymbol{E}+e\boldsymbol{v}\times\boldsymbol{B}

\begin{pmatrix}
E^{1}+v^{2}B^{3}-v^{3}B^{2}\\\
E^{2}+v^{3}B^{1}-v^{1}B^{3}\\\
E^{3}+v^{1}B^{2}-v^{2}B^{1}
\end{pmatrix}

=e\begin{pmatrix}
cF^{10}-v^{1}F^{11}-v^{2}F^{12}-v^{3}F^{13}\\
cF^{20}-v^{1}F^{21}-v^{2}F^{22}-v^{3}F^{23}\\
cF^{30}-v^{1}F^{31}-v^{2}F^{32}-v^{3}F^{33}
\end{pmatrix}

ここから、テンソルの方程式として

 m \displaystyle\frac{d^{2}x^{\mu}}{d\tau^{2}}=eg_{\nu\lambda}v^{\nu}F^{\mu\lambda}

と想像できる。

相対論的力学

ニュートン力学ガリレイ不変な力学であった。ではローレンツ変換で不変な力学はどのようなものになるか?これは実はそんなに難しいことではないのですが、いわゆるE=mc^{2}の式が出てきたりして、色々面白いです。
まず、運動方程式ローレンツ変換で形を変えないということは、各種物理量(運動量、エネルギー、角運動量)はテンソル量とならなければいけません。

p^{\mu}=m\displaystyle\frac{dx^{\mu}}{d\tau}

は、ローレンツ変換に対してテンソルとして振舞います。

p'^{\mu}= m\displaystyle \frac{dx^{\prime\mu}}{d\tau'}

= \displaystyle\frac{\partial x'^{\mu}}{\partial x^{\nu}}m\displaystyle\frac{dx^{\nu}}{d\tau}

= \displaystyle\frac{\partial x'^{\mu}}{\partial x^{\nu}}p^{\nu}

ローレンツ変換では、\displaystyle\frac{\partial x'^{\mu}}{\partial x^{\nu}}は時間に依存しない定数です。
こうすることで、テンソルとしての運動量を得られました。もちろんvが小さいときには、たとえばこれの第3成分(z成分)を見ると

 p^{3}=m\displaystyle\frac{dz}{d\tau}\approx m\displaystyle\frac{dz}{dt}

となり、ニュートン力学での運動量と一致しています。d\tau=\sqrt{1-\beta^{2}}dt\approx dtという近似)。

エネルギー

さあ、ここで疑問になるのはこの運動量の第0成分である:

 p^{0}=mc\displaystyle\frac{dt}{d\tau}


=\displaystyle\frac{mc} {\sqrt {1-\left( \displaystyle \frac {v}{c}\right) ^{2}}}

一体これは何なのかよくわからないから、ニュートン力学に何かヒントがないか探してみよう。vが光速cに対して小さいとして近似を取ると、

\displaystyle\frac{mc} {\sqrt {1-\left( \displaystyle \frac {v}{c}\right) ^{2}}}\approx mc\left(1+\displaystyle\frac{1}{2}\left(\displaystyle\frac{v}{c}\right)^{2}...\right)

これの第二項は、まさにニュートン力学の運動エネルギーの形をしている。つまり、特殊相対性原理を満たすためには、エネルギーの考え方を改めなくてはならないのである!

まとめ

光速不変の原理を満たすためには、慣性系間の座標変換はガリレイ変換ではなくローレンツ変換でなければならない。ガリレイ変換のときは、変換の前後でも時計の進む度合いは変わらなかったが、ローレンツ変換に対しては時計の進み方が変わる。つまり慣性系によって時間の進みも異なるため、時間はもはや単なるパラメータではなく、各慣性系を特徴付ける一種の力学的な量といえる。
つづいて、どの慣性系も同等である(特別な慣性系は存在しない)という特殊相対性原理に基づき、ローレンツ変換に際して運動方程式が変わらないように力学を再構築してみると、静止している物体にもエネルギーにもあることが要請された。