当サイトでは,ジョルダン標準形を複数の記事で解説しています.
初学者の方には,以下の順番で記事を読んでいただくことを強く推奨しています.
まずは,具体的な計算を通して,ジョルダン標準形の概念とその求め方を掴みます.2次正方行列については,以下の記事をご覧ください.
3次正方行列については,以下の記事をご覧ください.
実は,任意の正方行列に対して,それと相似なジョルダン標準形が存在します.この証明の準備として,ベクトル空間に関する新しい概念を学びます.
この記事では,ベクトル空間の和と直和の概念を用いることで,任意の冪零行列に対して,それと相似なジョルダン標準形が存在することを示します.証明は長いですが,ゆっくりと読み進めていけばきっと理解できるはずです.
最後に,一般の正方行列に対して,それと相似なジョルダン標準形が存在することを示します.正方行列を冪零行列に帰着させることによって,証明していきます.
ジョルダン標準形の定義
ジョルダン標準形は,次のように定義される正方行列である.
$\lambda \in \mathbb{C},n\in \mathbb{N}$とする.
$n$次正方行列
\[ \begin{pmatrix}\lambda &1&0&\cdots &0&0\\ 0&\lambda &1&\cdots &0&0\\ \vdots &\vdots &\vdots &\ddots &\vdots &\vdots \\ 0&0&0&\cdots &\lambda &1\\ 0&0&0&\cdots &0&\lambda \end{pmatrix}\]
をジョルダン細胞(Jordan cell)(またはジョルダンブロック(Jordan block))といい,$J(\lambda ;n)$で表す.
ただし,$J(\lambda ;1)=\lambda$とする.
$k\in \mathbb{N}$,$\lambda _1,\lambda _2,\dots ,\lambda _k\in \mathbb{C},n_1,n_2,\dots ,n_k\in \mathbb{N}$とする.
正方行列
\[ \begin{pmatrix}J(\lambda _1;n_1)&&&\text{\huge{0}}\\ &J(\lambda _2;n_2)&&\\ &&\ddots &\\ \text{\huge{0}}&&&J(\lambda _k;n_k)\end{pmatrix}\]
をジョルダン標準形(Jordan normal form)という.
$A$を正方行列とする.
$A$と相似であるジョルダン標準形$J$を求めることを,$A$を標準化(standardization)するという.
正方行列は対角化することにより,比較的シンプルな形で扱うことができるようになった.しかし,任意の正方行列が対角化可能であるとは限らない.対角化可能でない正方行列に対して,対角化の「代替的措置」として行うのが,正方行列の標準化である.対角行列はジョルダン標準形の一種であることに注意が必要である.
冪零行列
冪零行列とは,次のように定義される正方行列のことであった.
$A$を複素正方行列とする.
ある$m\in \mathbb{N}$が存在して,$A^m=O$となるとき,$A$を冪零行列(nilpotent matrix)という.
冪零行列の重要な性質として,次のようなものがあった.
$A$が冪零行列であることの必要十分条件は,$A$の任意の固有値が$0$であることである.
$n\in \mathbb{N}$,$A$を$n$次の冪零行列とする.
$A^k=O$となる最小の正の整数$k$を$m$とすると,$m\le n$である.
証明などの詳細は,次の記事を参照するとよい.
冪零行列のジョルダン標準形
任意の冪零行列に対して,相似なジョルダン標準形が存在する.
$n,k\in \mathbb{N}$,$A$を$n$次の冪零行列とする.
ある$n$次正則行列$P$と$m_1,m_2,\dots ,m_k\in \mathbb{N}$(ただし$m_1+m_2+\dots +m_k=n$)が存在して
\[ P^{-1}AP=\begin{pmatrix}J(0;m_1)&&&\text{\huge{0}}\\ &J(0;m_2)&&\\ &&\ddots &\\ \text{\huge{0}}&&&J(0;m_k)\end{pmatrix}\]
となる.特に,右辺はジョルダン細胞の並べ方を除いて一意的である.
$A=O$のとき,$n$次正則行列$P$を任意にとると
\[ P^{-1}OP=O=\begin{pmatrix}0&\cdots &0\\ \vdots &\ddots &\vdots \\ 0&\cdots &0\end{pmatrix}=\begin{pmatrix}J(0;1)&&&\text{\huge{0}}\\ &J(0;1)&&\\ &&\ddots &\\ \text{\huge{0}}&&&J(0;1)\end{pmatrix}\]
となるから,明らかに成り立つ.
$A\neq O$のとき,$A^m=O$となる最小の正の整数を$k$とすると,定理2より,$2\le k\le n$である.
任意の$i\in \{ 1,2,\dots ,k\}$に対して
\[ W_0=\{ \bm{0}\} ,\quad W_i\coloneqq \{ \bm{x}\in \mathbb{C}^n\mid A^i\bm{x}=\bm{0}\} \]
を定める.
$A$は正則でないから,$A^i$も正則でない.よって,$W_i\neq \{ \bm{0}\}$である.
任意の$j\in \{ 2,3,\dots ,k\}$に対して,$\bm{x}\in W_{j-1}$ならば,$A^{j-1}\bm{x}=\bm{0}$であるから,$A^j\bm{x}=\bm{0}$,すなわち$\bm{x}\in W_j$である.ゆえに,$W_{j-1}\subset W_j$であるから
\[ W_1\subset W_2\subset \dots \subset W_k=\mathbb{C}^n\]
ここで
\[ \begin{aligned}d_1&=\dim W_1\\ d_j&=\dim W_j-\dim W_{j-1}\\ d_{k+1}&=0\end{aligned}\]
とおくと
\[ \begin{aligned}&\sum _{i=1}^kd_i=\dim W_1+\sum _{j=2}^kd_j\\ =&\dim W_k=\dim \mathbb{C}^n=n\end{aligned}\]
である.
また,$k$の定義より,$d_k\ge 1$であることに注意すると,$W_{k-1}$の基底$\{ \bm{y}_1,\bm{y}_2,\dots ,\bm{y}_{\dim W_{k-1}}\}$をとり,$\bm{x}_1,\bm{x}_2,\dots ,\bm{x}_{d_k}\in W_k$を$\{ \bm{y}_1,\bm{y}_2,\dots ,\bm{y}_{\dim W_{k-1}},\bm{x}_1,\bm{x}_2,\dots ,\bm{x}_{d_k}\}$が$W_k$の基底となるようにとることができる.このとき,明らかに$\bm{x}_1,\bm{x}_2,\dots ,\bm{x}_{d_k}$は1次独立であり
\[ \dim W_k=\dim W_{k-1}+d_k\]
であるから
\[ W_k=W_{k-1}\oplus \langle \bm{x}_1,\bm{x}_2,\dots ,\bm{x}_{d_k}\rangle _{\mathbb{C}}\tag{A}\]
よって,次が成り立つ.
- $A\bm{x}_1,A\bm{x}_2,\dots ,A\bm{x}_{d_k}\in W_{k-1}$
- $A\bm{x}_1,A\bm{x}_2,\dots ,A\bm{x}_{d_k}$は1次独立である.
- $W_{k-2}\cap \langle A\bm{x}_1,A\bm{x}_2,\dots ,A\bm{x}_{d_k}\rangle _{\mathbb{C}}=\{ \bm{0}\}$
①を示す.任意の$l\in \{ 1,2,\dots ,d_k\}$に対して
\[ A^{k-1}A\bm{x}_l=A^k\bm{x}_l=O\bm{x}_l=\bm{0}\]
であるから,$\bm{x}_l\in W_{k-1}$
②を示す.$c_1,c_2,\dots ,c_{d_k}\in \mathbb{C}$が
\[ c_1A\bm{x}_1+c_2A\bm{x}_2+\dots +c_{d_k}A\bm{x}_{d_k}=\bm{0}\]
すなわち
\[ A(c_1\bm{x}_1+c_2\bm{x}_2+\dots +c_{d_k}\bm{x}_{d_k})=\bm{0}\]
を満たすとき
\[ c_1\bm{x}_1+c_2\bm{x}_2+\dots +c_{d_k}\bm{x}_{d_k}\in W_1\]
であるから,$W_1\subset W_{k-1}$より
\[ c_1\bm{x}_1+c_2\bm{x}_2+\dots +c_{d_k}\bm{x}_{d_k}\in W_{k-1}\]
よって
\[ c_1\bm{x}_1+c_2\bm{x}_2+\dots +c_{d_k}\bm{x}_{d_k}\in W_{k-1}\cap \langle \bm{x}_1,\bm{x}_2,\dots ,\bm{x}_{d_k}\rangle _{\mathbb{C}}\]
$\rm (A)$より
\[ W_{k-1}\cap \langle \bm{x}_1,\bm{x}_2,\dots ,\bm{x}_{d_k}\rangle _{\mathbb{C}}=\{ \bm{0}\} \]
であるから
\[ c_1\bm{x}_1+c_2\bm{x}_2+\dots +c_{d_k}\bm{x}_{d_k}=\bm{0}\]
を得る.$\bm{x}_1,\bm{x}_2,\dots ,\bm{x}_{d_k}$は1次独立であるから
\[ c_1=c_2=\dots =c_{d_k}=0\]
したがって,$A\bm{x}_1,A\bm{x}_2,\dots ,A\bm{x}_{d_k}$は1次独立である.
③を示す.$c_1^{\prime},c_2^{\prime},\dots ,c_{d_k}^{\prime}\in \mathbb{C}$が
\[ c_1^{\prime}A\bm{x}_1+c_2^{\prime}A\bm{x}_2+\dots +c_{d_k}^{\prime}A\bm{x}_{d_k}\in W_{k-2}\]
を満たすとき
\[ \begin{aligned}&A^{k-1}(c_1^{\prime}\bm{x}_1+c_2^{\prime}\bm{x}_2+\dots +c_{d_k}^{\prime}\bm{x}_{d_k})\\ =&A^{k-2}(c_1^{\prime}A\bm{x}_1+c_2^{\prime}A\bm{x}_2+\dots +c_{d_k}^{\prime}A\bm{x}_{d_k})\\ =&\bm{0}\end{aligned}\]
であるから
\[ c_1^{\prime}\bm{x}_1+c_2^{\prime}\bm{x}_2+\dots +c_{d_k}^{\prime}\bm{x}_{d_k}\in W_{k-1}\cap \langle \bm{x}_1,\bm{x}_2,\dots ,\bm{x}_{d_k}\rangle _{\mathbb{C}}\]
ここで,$\rm (A)$より
\[ W_{k-1}\cap \langle \bm{x}_1,\bm{x}_2,\dots ,\bm{x}_{d_k}\rangle _{\mathbb{C}}=\{ \bm{0}\} \]
であるから
\[ c_1^{\prime}\bm{x}_1+c_2^{\prime}\bm{x}_2+\dots +c_{d_k}^{\prime}\bm{x}_{d_k}=\bm{0}\]
を得る.$\bm{x}_1,\bm{x}_2,\dots ,\bm{x}_{d_k}$は1次独立であるから
\[ c_1^{\prime}=c_2^{\prime}=\dots =c_{d_k}^{\prime}=0\]
したがって
\[ W_{k-2}\cap \langle A\bm{x}_1,A\bm{x}_2,\dots ,A\bm{x}_{d_k}\rangle _{\mathbb{C}}={ \bm{0}}\]
を得る.
③より
\[ \begin{aligned}&W_{k-2}+\langle A\bm{x}_1,A\bm{x}_2,\dots ,A\bm{x}_{d_k}\rangle _{\mathbb{C}}\\ =&W_{k-2}\oplus \langle A\bm{x}_1,A\bm{x}_2,\dots ,A\bm{x}_{d_k}\rangle _{\mathbb{C}}\end{aligned}\]
であるから,①より
\[ W_{k-2}\oplus \langle A\bm{x}_1,A\bm{x}_2,\dots ,A\bm{x}_{d_k}\rangle _{\mathbb{C}}\subset W_{k-1}\]
よって
\[ \dim W_{k-2}+d_k\le \dim W_{k-1}\]
であるから
\[ 1\le d_k\le d_{k-1}\]
を得る.
同様にして
\[ 1\le d_k\le d_{k-1}\le \dots \le d_1\]
を得る.
また,同様の議論により,ある1次独立な$\bm{y}_1,\bm{y}_2,\dots ,\bm{y}_{d_1}\in \mathbb{C}^n$が存在して,次が成り立つ.
- \[ \begin{array}{lll}\{ &\bm{y}_1,\bm{y}_2,\dots ,\bm{y}_{d_1},&\\ &A\bm{y}_1,A\bm{y}_2,\dots ,A\bm{y}_{d_{k-1}},&\\ &A^2\bm{y}_1,A^2\bm{y}_2,\dots ,A^2\bm{y}_{d_{k-2}},&\\ &\dots ,&\\ &A^{k-1}\bm{y}_1,A^{k-1}\bm{y}_2,\dots ,A^{k-1}\bm{y}_{d_1}&\} \end{array}\]
は$\mathbb{C}^n$の基底である. - 任意の$j\in \{ 2,3,\dots ,k\}$に対して
\[ W_j=W_{j-1}\oplus \langle A^{k-j}\bm{y}_1,\dots ,A^{k-j}\bm{y}_{d_k},A^{k-j-1}\bm{y}_{d_k+1},\dots ,A^{k-j-1}\bm{y}_{d_{k-1}},\dots ,\bm{y}_{d_{j+1}+1},\dots ,\bm{y}_{d_j}\rangle _{\mathbb{C}}\]
$s\in \{ 1,2,\dots ,k\} ,t\in \{ d_{s+1}+1.d_{s+1}+2,\dots ,d_s\}$とする.
⑤より,$\bm{y}_t\in W_s$であることに注意する.
\[ P_{s,t}=\begin{pmatrix}A^{s-1}\bm{y}_t&A^{s-2}\bm{y}_t&\cdots &\bm{y}_t\end{pmatrix}\]
\[ P=\begin{pmatrix}P_{k,1}&\cdots &P_{k,d_k}&P_{k-1,1}&\cdots &P_{k-1,d_{k-1}}&\cdots &P_{1,1}&\cdots &P_{1,d_1}\end{pmatrix}\]
とおくと,④より$P$は正則であり
\[ \begin{aligned}AP_{s,t}&=\begin{pmatrix}A^s\bm{y}_t&A^{s-1}\bm{y}_t&\cdots &A\bm{y}_t\end{pmatrix}\\ &=\begin{pmatrix}\bm{0}&A^{s-1}\bm{y}_t&\cdots &A\bm{y}_t\end{pmatrix}\\ &=\begin{pmatrix}A^{s-1}\bm{y}_t&A^{s-2}\bm{y}_t&\cdots &\bm{y}_t\end{pmatrix}\begin{pmatrix}0&1&0&\cdots &0&0\\ 0&0&1&\cdots &0&0\\ \vdots &\vdots &\vdots &\ddots &\vdots &\vdots \\ 0&0&0&\cdots &0&1\\ 0&0&0&\cdots &0&0\end{pmatrix}\\ &=P_{s,t}J(0;s)\end{aligned}\]
であるから
\[ \begin{aligned}AP&=\begin{pmatrix}AP_{k,1}&\cdots &AP_{k,d_k}&AP_{k-1,d_k+1}&\cdots &AP_{k-1,d_{k-1}}&\cdots &AP_{1,d_2+1}&\cdots &AP_{1,d_1}\end{pmatrix}\\ &=\begin{pmatrix}P_{k,1}J(0;k)&\cdots &P_{k,d_k}J(0;k)&P_{k-1,d_k+1}J(0;k-1)&\cdots &P_{k-1,d_{k-1}}J(0;k-1)&\cdots &P_{1,d_2+1}J(0;1)&\cdots &P_{1,d_1}J(0;1)\end{pmatrix}\\ &=\begin{pmatrix}P_{k,1}&\cdots &P_{k,d_k}&P_{k-1,d_k+1}&\cdots &P_{k-1,d_{k-1}}&\cdots &P_{1,d_2+1}&\cdots &P_{1,d_1}\end{pmatrix}\begin{pmatrix}J(0;k)&&&&&&\text{\huge{0}}\\ &\ddots &&&&&\\ &&J(0;k)&&&&\\ &&&\ddots &&&\\ &&&&J(0;1)&&\\ &&&&&\ddots &\\ \text{\huge{0}}&&&&&&J(0;1)\end{pmatrix}\\ &=P\begin{pmatrix}J(0;k)&&&&&&\text{\huge{0}}\\ &\ddots &&&&&\\ &&J(0;k)&&&&\\ &&&\ddots &&&\\ &&&&J(0;1)&&\\ &&&&&\ddots &\\ \text{\huge{0}}&&&&&&J(0;1)\end{pmatrix}\end{aligned}\]
したがって
\[ P^{-1}AP=\begin{pmatrix}J(0;k)&&&&&&\text{\huge{0}}\\ &\ddots &&&&&\\ &&J(0;k)&&&&\\ &&&\ddots &&&\\ &&&&J(0;1)&&\\ &&&&&\ddots &\\ \text{\huge{0}}&&&&&&J(0;1)\end{pmatrix}\]
を得る.
また,右辺に含まれる$J(0;i)$の個数は
\[ \begin{aligned}d_{i+1}-d_i&=(\dim W_i-\dim W_{i+1})-(\dim W_{i-1}-\dim W_i)\\ &=2\dim W_i-\dim W_{i+1}-\dim W_{i-1}\\ &=2(n-\operatorname{rank}A^i)-(n-\operatorname{rank}A^{i+1})-(n-\operatorname{rank}A^{i-1})\\ &=\operatorname{rank}A^{i+1}+\operatorname{rank}A^{i-1}-2\operatorname{rank}A^i\end{aligned}\]
で与えられ,ジョルダン細胞の並べ方に依らない.$\blacksquare$
冪零行列の標準化の例
定理3の証明では,冪零行列と相似なジョルダン標準形を理論的に構成したが,具体的な(2次や3次の)冪零行列に対しては,以下の記事で扱っている方法と同様にして求めるとよい.


$A=\begin{pmatrix}0&2&3\\ 0&0&5\\ 0&0&0\end{pmatrix}$は冪零行列である.
実際
\[ A^2=\begin{pmatrix}0&0&10\\ 0&0&0\\ 0&0&0\end{pmatrix}\\ A^3=\begin{pmatrix}0&0&0\\ 0&0&0\\ 0&0&0\end{pmatrix}=O\]
である.
$A$の固有多項式$\phi _A(\lambda)$は
\[ \begin{aligned}\phi _A(\lambda )&=|A-\lambda E|\\ &=\begin{vmatrix}-\lambda &2&3\\ 0&-\lambda &5\\ 0&0&-\lambda \end{vmatrix}\\ &=-\lambda^3\end{aligned}\]
であるから,$A$の固有値は$0$である(定理1).
ここで,連立1次方程式
\[ A\bm{x}=\bm{0}\]
すなわち
\[ \begin{pmatrix}0&2&3\\ 0&0&5\\ 0&0&0\end{pmatrix}\bm{x}=\bm{0}\]
を解くと
\[ \bm{x}=c\begin{pmatrix}1\\ 0\\ 0\end{pmatrix}\quad (c\in \mathbb{C})\]
であるから,固有値$0$に対する$A$の固有空間の次元は$1$である.
よって,$A$を標準化すると1
\[ \begin{pmatrix}0&1&0\\ 0&0&1\\ 0&0&0\end{pmatrix}\]
となる(定理3).
- 以下の記事の定理1を参照するとよい.
https://mathabyss.com/3-jordan_normal_form ↩︎