行列ノルム

線型代数学における行列ノルム（ぎょうれつノルム、英: matrix norm）は、ベクトルのノルムを行列に対し自然に一般化したものである。

性質

以下では体 K を実数体 R または複素数体 C のいずれかを指すものとして用いる。また、K^m×n を、K の元を成分に持つ m 行 n 列の矩形行列の全体が、通常の和とスカラー倍に関してなすベクトル空間とする。K^m×n 上の行列のノルムはベクトルとしてのノルムである。すなわち、行列 A のノルムを ‖ A ‖ で表せば

正定値性：‖ A ‖ ≥ 0 かつ等号成立は A = O と同値
斉次性：α ∈ K, A ∈ K^m×n ならば ‖ αA ‖ = |α|‖ A ‖
劣加法性：A, B ∈ K^m×n ならば ‖ A + B ‖ ≤ ‖ A ‖ + ‖ B ‖

が全て満たされる。

正方行列 (m = n) に関して、以下に挙げる条件を課す場合がある。

劣乗法性: ‖ AB ‖ ≤ ‖ A ‖‖ B ‖
∗-性: ‖ A ‖ = ‖ A^∗ ‖

ここで A^∗ は複素行列 A の随伴を表す。A が実である場合、その随伴は A^∗ は転置 A^⊤ に一致する。

劣乗法性を持つノルムを劣乗法的ノルム (sub-multiplicative norm) と呼ぶ^{[注 1]}。劣乗法的ノルムを備えた n 次の正方行列全体の成す集合はバナッハ代数の一例である。

誘導されたノルム

2つのベクトル空間 K^m, Kⁿ におけるベクトルのノルムが与えられているとき、それらに対応して m × n 行列の空間 K^m×n 上の行列ノルムを与えることができる。

{\begin{aligned}\|A\|&=\max _{x\in \mathbb {K} ^{n} \atop \|x\|_{\mathbb {K} ^{n}}\leq 1}\|Ax\|_{\mathbb {K} ^{m}}\\[8pt]&=\max _{x\in \mathbb {K} ^{n} \atop \|x\|_{\mathbb {K} ^{n}}=1}\|Ax\|_{\mathbb {K} ^{m}}\\&=\max _{\ x\in \mathbb {K} ^{n} \atop x\neq 0}{\frac {\|Ax\|_{\mathbb {K} ^{m}}}{\|x\|_{\mathbb {K} ^{n}}}}\end{aligned}}

この行列ノルムは誘導ノルム (induced norm) あるいは作用素ノルム (operator norm) と呼ばれる。m = n で行列の定める線型写像の定義域と値域で同じノルムを用いている場合、誘導される作用素ノルムは劣乗法的である。ベクトルの p ノルムに対応して、作用素ノルム

\|A\|_{p}=\max _{x\neq 0}{\frac {\|Ax\|_{p}}{\|x\|_{p}}}

が得られる^{[注 2]}。特に p = 1 と p = ∞ に対しては

{\begin{alignedat}{2}&\|A\|_{1}&=&\max _{1\leq j\leq n}\sum _{i=1}^{m}|a_{ij}|,\\&\|A\|_{\infty }&=&\max _{1\leq i\leq m}\sum _{j=1}^{n}|a_{ij}|\end{alignedat}}

と計算することができる（前者は各列に対する「成分の絶対値の和」の最大の値で、後者は各行に対する同様の和の最大の値である）。

特に p = 2 かつ m = n, つまり正方行列に対してユークリッドノルムを考えた場合には、誘導された行列ノルムはスペクトルノルム (spectral norm) になる。行列 A のスペクトルノルムとは A の最大の特異値、別な言い方をすれば半正定値行列 A^∗ A の最大固有値の平方根

\|A\|_{2}={\sqrt {\lambda _{\text{max}}(A^{*}A)}}=\sigma _{\text{max}}(A)

で与えられる。ここで A^∗ は複素行列 A の随伴行列を表す。

ρ(A) を A のスペクトル半径とすると、誘導ノルムはいずれも不等式

\|A\|\geq \rho (A)

を満たす（スペクトル半径は下界を与えている）。つまり ρ(A) は A の誘導ノルム全体を動かしたときの下限である。さらに言えば、

\lim _{r\to \infty }\|A^{r}\|^{1/r}=\rho (A)

というスペクトル半径公式も得られる。

成分ごとのノルム

行列の成分ごとのノルムとは、m 行 n 列の行列を mn 成分のベクトルと見なして、ベクトルの通常のノルムを考えたものである。例えばベクトルの p ノルムを利用すれば

\|A\|_{p}=\left(\textstyle \sum \limits _{i=1}^{m}\sum \limits _{j=1}^{n}|a_{ij}|^{p}\right)^{\!\!1/p}

というノルムが得られる^{[注 2]}。特別の場合として、p = 2 のときはフロベニウスノルムが、p = ∞ のときは最大値ノルムがそれぞれ得られる。

フロベニウスノルム

p = 2 の場合はフロベニウスノルム (Frobenius norm) またはヒルベルト＝シュミットノルム (Hilbert–Schmidt norm) と呼ばれる（後者は普通、ヒルベルト空間の作用素に限定して使われる）。このノルムはいくつか異なる定義があるが、

\|A\|_{F}={\sqrt {\textstyle \sum \limits _{i=1}^{m}\sum \limits _{j=1}^{n}|a_{ij}|^{2}}}={\sqrt {\operatorname {tr} (A^{*}A)}}={\sqrt {\textstyle \sum \limits _{i=1}^{\min\{m,n\}}\!\!\!\!{\sigma _{i}}^{2}}}

のように書くことができる。ここで A^∗ は行列 A の随伴、σ_i は行列 A の特異値、tr は行列のトレースを表わす。フロベニウスノルムは Kⁿ 上のユークリッドノルムと似て、行列の空間上の（行列を単にベクトルと見なした）標準内積から得られるノルムになっている。

フロベニウスノルムは劣乗法的である。数値線型代数学において有益であり、またフロベニウスノルムは誘導ノルムより計算が容易なことが多い。

最大ノルム

最大ノルム (max norm) は p = ∞ に対する成分ごとのノルムとして

\|A\|_{\max }=\max\{|a_{ij}|\}

で定義される。これは劣乗法的ノルムではない。

シャッテンノルム

詳細は「シャッテンノルム」を参照

シャッテンノルム (Schatten norm) は行列の特異値を並べたベクトルに対するノルムとして得られる。ベクトルノルムに p ノルムを用いるものをシャッテン p ノルムと呼ぶ。行列 A のシャッテン p-ノルムは、A の特異値を σ_i で表せば、以下のように定義される^{[注 2]}。

\|A\|_{p}=\left(\sum _{i=1}^{\min\{m,n\}}\!\!\!\!\sigma _{i}^{p}\right)^{\!\!1/p}

シャッテンノルムはいずれの p に対しても劣乗法的である。また、任意の行列 A のユニタリ変換に対してシャッテンノルムは不変であり^{[注 3]}、任意のユニタリ行列 U, V 対して ‖ UAV ‖ = ‖ A ‖ が成り立つ。

p = 1, 2, ∞ の場合がよく知られており、p = 2 の場合はフロベニウスノルムが得られる。p = ∞ はスペクトルノルム、すなわちベクトルの 2 ノルムから誘導される行列ノルムである。

トレースノルム

p = 1 からは核型ノルム (nuclear norm)、トレースノルム、あるいは樊畿^{[注 4]}(Ky Fan) の n ノルムとして知られるノルム

\|A\|_{\text{trace}}=\operatorname {tr} ({\sqrt {A^{*}A}})=\!\!\!\sum _{i=1}^{\min\{m,n\}}\!\!\!\!\sigma _{i}

が定まる。ここで行列 A^∗ A の平方根は BB = A^∗ A を満たす行列 B の意味で用いている。

両立するノルム

空間 K^m×n 上の行列ノルム ‖ • ‖_ab は Kⁿ 上のノルム ‖ • ‖_a と K^m 上のノルム ‖ • ‖_b に対して

\|Ax\|_{b}\leq \|A\|_{ab}\|x\|_{a}

を満たすとき、‖ • ‖_a, ‖ • ‖_b と両立する (consistent) という。‖ • ‖_a, ‖ • ‖_b から誘導される作用素ノルムは、その定義から明らかに ‖ • ‖_a, ‖ • ‖_b と両立する。誘導ノルムをベクトルのノルムと両立する行列ノルムにまで広げても、スペクトル半径が下限を与えるという命題はなお正しい。

ノルムの同値性

有限次元ベクトル空間 K^m×n の任意の2つの（ベクトルとしての）ノルム ‖ • ‖_α, ‖ • ‖_β に対して、適当な定数 r, s > 0 をとれば

r\left\|A\right\|_{\alpha }\leq \left\|A\right\|_{\beta }\leq s\left\|A\right\|_{\alpha }

が任意の行列 A ∈ K^m×n に対して成立するようにできる。言い換えれば、このようなノルムはどれも同値 (equivalent) なノルムであり、空間 K^m×n に同じ位相を誘導する。

さらに実行列 A ∈ R^n×n の場合、任意のノルム ‖ • ‖ に対し一意な正の定数 k が存在して、k‖ A ‖ が（劣乗法的な）行列ノルムになる。

行列ノルム ‖ • ‖_p は、他のいかなる行列ノルム ‖ • ‖_q も ‖ • ‖_q ≤ ‖ • ‖_p を満たさないとき、極小（英: minimal）であると呼ばれる。

同値なノルムの例

実行列 A ∈ R^m×n に対し、以下の不等式が成立する^[1]^[2]：

$\|A\|_{2}\leq \|A\|_{F}\leq {\sqrt {r}}\|A\|_{2}$
$\|A\|_{F}\leq \|A\|_{*}\leq {\sqrt {r}}\|A\|_{F}$
$\|A\|_{\max }\leq \|A\|_{2}\leq {\sqrt {mn}}\|A\|_{\max }$
${\frac {1}{\sqrt {n}}}\|A\|_{\infty }\leq \|A\|_{2}\leq {\sqrt {m}}\|A\|_{\infty }$
${\frac {1}{\sqrt {m}}}\|A\|_{1}\leq \|A\|_{2}\leq {\sqrt {n}}\|A\|_{1}$

ここで r は行列 A のランクである。

他にも次のような関係は有用である：

$\|A\|_{2}\leq {\sqrt {\|A\|_{1}\|A\|_{\infty }}}$

これはヘルダーの不等式の特殊例である。

注釈

^ 文献によっては劣乗法的なものに限って行列ノルムと呼ぶものもある。
^ ^a ^b ^c 同じ記法 ‖ • ‖_p を用いるため紛らわしいが、誘導ノルムと成分ごとのノルム、シャッテン p ノルムはそれぞれ異なるノルムである。
^ ユニタリ変換に対する不変性はユニタリ不変性 (unitary invariance) と呼ばれる。
^ 正しくは樊（樊と土偏に畿、U+302C0）と書くが、表示できる環境が少ないため畿の字を代用する。中国系アメリカ人数学者 Ky Fan にちなんだ呼称

出典

^ Golub & Van Loan 1996, pp. 56–57.
^ Horn & Johnson 1985, Chapter 5.

参考文献

Golub, Gene; Van Loan, Charles F. (1996). Matrix Computations (3rd ed.). Baltimore: The Johns Hopkins University Press. ISBN 0-8018-5413-X
Horn, Roger; Johnson, Charles (1985). Matrix Analysis. Cambridge University Press. ISBN 0-521-38632-2
Demmel, James W. (1997). “1.7”. Applied Numerical Linear Algebra. Society for Industrial and Applied Mathematics (SIAM). ISBN 0-89871-389-7
Meyer, Carl D. (2000). Matrix Analysis and Applied Linear Algebra. Society for Industrial and Applied Mathematics (SIAM). http://www.matrixanalysis.com
Watrous, John (2008), “2.4 Norms of operators”, Theory of Quantum Information, University of Waterloo, https://cs.uwaterloo.ca/~watrous/LectureNotes.html 2016年5月28日閲覧。