ここでは行列 A が対角化出来る場合, 即ち対角行列と相似になる場合を考える。 このような行列を半単純行列 semisimple matrix という。
先ず A = (ajk), B = (bjk) とする。 この時今まで何度か出て来た det(AB) = det(A)det(B) を証明しておこう。 (lhs は左辺, rhs は右辺)
lhs = det | ( | a11b11 + a12b21 a11b12 + a12b22 | ) |
a21b11 + a22b21 a21b12 + a22b22 |
= (a11b11 + a12b21)(a21b12
+ a22b22) - (a11b12 + a12b22)(a21b11
+ a22b21)
= a11a21b11b12 + a11a22b11b22
+ a12a21b21b12 + a12a22b21b22
- a11a21b11b12 - a11a22b12b21
- a12a21b11b22 - a12a22b21b22
= a11a22(b11b22 - b12b21)
- a12a21(b11b22 - b21b12)
= (a11a22 - a12a21)(b11b22
- b12b21) = rhs□
従って A〜D とすると正則行列 P が存在して, A = P-1DP であるから固有多項式に関して
ΦA(t) = ΦP-1DP(t) = det(tI2 - P-1DP)
= det(P-1(tI2 - D)P)
= det(P-1)det(tI2 - D)det(P) = det(P-1)det(P)det(tI2
- D)
= det(P-1P)det(tI2 - D) = det(I2)det(tI2
- D)
= ΦD(t).
特に D = diag(α, β) とすると,
ΦD(t) = det | ( | t - α | 0 | ) |
0 | t - β |
= (t - α)(t - β)
である。
最初に A〜D = diag(α, α) = αI2 である場合を考えよう。 これは scalar 行列であるから, 自分自身とだけ相似である。 ということは即ち最初から A = diag(α, α) = αI2 である。 この行列の固有多項式は明らかに ΦA(t) = (t - α)2 であり, Cayley-Hamailton の公式により ΦA(A) = (A - αI2)2 = 0 なのであるが, 良く考えると最初から A - αI2 = 0 なのであった。
一般に f(x) を x の多項式とし, f(A) = 0 となるもののうち, 次数が最小のものを A の最小多項式 minimal polynomial という。
つまり scalar 行列 A = diag(α, α) = αI2 の場合には, 最小多項式は, 一次式 x - α であることを示している。
次に A 〜D = diag(α, β), α ≠ β の場合を考えよう。 この場合, α, β は固有方程式 ΦA(t) = t2 - tr(A)t + det(A) = 0 の解であるが, 仮定によって重解ではないので, この方程式の t に関する判別式 Dt を採ると, Dt = (tr(A))2 - det(A) ≠ 0 である。
この時固有値の定義から
Ap1 = αp1,
Ap2 = βp2 … (1)
となる, p1, p2 (≠ 0) が存在するが, この二式を纏めて書くと
A(p1 p2) = (p1 p2) | ( | α | 0 | ) | … (2) |
0 | β |
である。 ここで P = (p1 p2) が正則であることを証明しよう。 その為には, 基底とその変換の所で示したように, p1, p2 が一次独立 (即ち平行でない) ことを示せば良い。 固有ベクトルの定義から, p1≠ 0, p2 ≠ 0 であるから, P が退化しているとすれば, 平行と一次独立の所で示したように, p2 = kp1 と書ける。 これを (1) に代入すると A(kp1) = kβp1 であるが, この式の左辺は k(Ap1) = kαp1 に等しいから即ち kαp1 = kβp2 つまり k(α - β)p1 = 0. ところが α ≠ β で k ≠ 0 (p2 ≠ 0 だから), p1≠ 0 だから矛盾である。 従って P = (p1 p2) は正則である。 従って (2) から
(p1 p2)-1A(p1 p2) = | ( | α | 0 | ) |
0 | β |
即ち P-1AP = diag(α, β) となる。
以上を纏めておこう。
定理
A を二次正方行列とし, その固有値を α1 ≠ α2, 対応する固有ベクトルを pj とする。 この時 P = (pj) は正則で P-1AP = diag(α1, α2) となる。
さて, この場合に成分を使わない表現についても述べておく。 行列 A について, 上記の定理の仮定が成立しているとしよう。 この時任意のベクトルは
x = a1p1 + a2p2
と書けるが, これに A を左から作用させると, 仮定により
Ax = a1Ap1 + a2Ap2 = a1α1p1 + a2α2p2.
従って特に
(A - α1I2)p1 = 0,
(A - α2I2)p1
= (α1 - α2)p1,
(A - α1I2)p2 = (α2 - α1)p2,
(A - α1I2)p1
= 0.
である。 よって
P1 = (1/(α1 - α2))(A - α2I2),
P2 = (1/(α2 - α1))(A - α1I2)
と置くと,
A = α1P1 + α2P2
であり, P1P2 = P2P1 = 0 でしかも (Pi)2 = Pi. これらが実は対角化するという意味である。 実際
P1p1 = p1,
P1p2 = 0,
P2p1 = 0, P2p2
= p2
であるから。