行列ノルム
線型代数学における行列ノルム(ぎょうれつノルム、英: matrix norm)は、ベクトルのノルムを行列に対し自然に一般化したものである。
Contents
性質
以下では体 K を実数体 R または複素数体 C のいずれかを指すものとして用いる。また、Km×n を、K の元を成分に持つ m 行 n 列の矩形行列の全体が、通常の和とスカラー倍に関してなすベクトル空間とする。Km×n 上の行列のノルムはベクトルとしてのノルムである。すなわち、行列 A のノルムを テンプレート:Norm で表せば
- 正定値性: テンプレート:Norm ≥ 0 かつ等号成立は A = O と同値
- 斉次性: α ∈ K, A ∈ Km×n ならば テンプレート:Norm = テンプレート:Absテンプレート:Norm
- 劣加法性: A, B ∈ Km×n ならば テンプレート:Norm ≤ テンプレート:Norm + テンプレート:Norm
が全て満たされる。
正方行列 (m = n) に関して、以下に挙げる条件を課す場合がある。
- {{safesubst:#invoke:Anchor|main}} 劣乗法性: テンプレート:Norm ≤ テンプレート:Normテンプレート:Norm
- ∗-性: テンプレート:Norm = テンプレート:Norm
ここで A∗ は複素行列 A の随伴を表わす。A が実である場合、その随伴は A∗ は転置 Aテンプレート:Mtop に一致する。
劣乗法性を持つノルムを劣乗法的ノルム (sub-multiplicative norm) と呼ぶ[注 1]。劣乗法的ノルムを備えた n 次の正方行列全体の成す集合はバナッハ代数の一例である。
{{safesubst:#invoke:Anchor|main}}誘導されたノルム
2つのベクトル空間 Km, Kn におけるベクトルのノルムが与えられているとき、それらに対応して m × n 行列の空間 Km×n 上の行列ノルムを与えることができる。
- [math]\begin{align} \|A\| & := \max_{x\in \mathbb{K}^n\atop \|x\|_{\mathbb{K}^n}\le 1} \|Ax\|_{\mathbb{K}^m} \\[8pt] & = \max_{x\in \mathbb{K}^n\atop \|x\|_{\mathbb{K}^n} = 1} \|Ax\|_{\mathbb{K}^m} \\ & = \max_{\ x\in \mathbb{K}^n\atop x\ne 0} \frac{\|Ax\|_{\mathbb{K}^m}}{\|x\|_{\mathbb{K}^n}} \end{align}[/math]
この行列ノルムは誘導ノルム (induced norm) あるいは作用素ノルム (operator norm) と呼ばれる。m = n で行列の定める線型写像の定義域と値域で同じノルムを用いている場合、誘導される作用素ノルムは劣乗法的である。ベクトルの p ノルムに対応して、作用素ノルム
- [math]\| A\|_p := \max_{x \ne 0} \frac{ \| Ax\|_p}{\| x\|_p}[/math]
が得られる[注 2]。特に p = 1 と p = ∞ に対しては
- [math]\begin{alignat}{2} & \| A\|_1 & = &\max_{1 \leq j \leq n} \sum_{i=1}^m |a_{ij}|, \\ & \| A\|_\infty & = &\max_{1 \leq i \leq m} \sum_{j=1}^n |a_{ij}| \end{alignat}[/math]
と計算することができる(前者は列ごとに成分の絶対値の和を計算したうちでその最大のもの、後者は行ごとに同様の和を考えたときの最大のもの、を単に考えればよいということである)。
{{safesubst:#invoke:Anchor|main}} 特に p = 2 かつ m = n, つまり正方行列に対してユークリッドノルムを考えた場合には、誘導された行列ノルムはスペクトルノルム (spectral norm) になる。行列 A のスペクトルノルムとは A の最大の特異値、別な言い方をすれば半正定値行列 A∗ A の最大固有値の平方根
- [math]\| A\|_2 = \sqrt{\lambda_{\text{max}}(A^* A)} =: \sigma_\text{max}(A)[/math]
で与えられる。ここで A∗ は複素行列 A の随伴行列を表す。
ρ(A) を A のスペクトル半径とすると、誘導ノルムはいずれも不等式
- [math]\| A \| \ge \rho(A)[/math]
を満たす(スペクトル半径は下界を与えている)。実は ρ(A) は A の誘導ノルム全体を動かしたときの下限を与えているのである。さらに言えば、
- [math]\lim_{r\to\infty}\|A^r\|^{1/r}=\rho(A)[/math]
なるスペクトル半径公式を得ることができる。
成分ごとのノルム
行列の成分ごとのノルムとは、m 行 n 列の行列を mn 成分のベクトルと見なして、ベクトルの通常のノルムを考えたものである。例えばベクトルの p ノルムを利用すれば
- [math]\| A\|_{p} = \left(\sum_{i=1}^m \sum_{j=1}^n |a_{ij}|^p \right)^{\!\!1/p}[/math]
というノルムが得られる[注 2]。特別の場合として、p = 2 のときはフロベニウスノルムが、p = ∞ のときは最大値ノルムがそれぞれ得られる。
フロベニウスノルム
p = 2 の場合はフロベニウスノルム (Frobenius norm) またはヒルベルト=シュミットノルム (Hilbert–Schmidt norm) と呼ばれる(後者は普通、ヒルベルト空間の作用素に限定して使われる)。 このノルムはいくつか異なる定義があるが、
- [math]\|A\|_F = \sqrt{\sum_{i=1}^m\sum_{j=1}^n |a_{ij}|^2} = \sqrt{\operatorname{tr}(A^* A)} = \sqrt{\sum_{i=1}^{\min\{m,n\}}\!\!\!\! \sigma_{i}^2}[/math]
のように書くことができる。ここで A∗ は行列 A の随伴、σi は行列 A の特異値、tr は行列のトレースを表わす。フロベニウスノルムは Kn 上のユークリッドノルムと似て、行列の空間上の(行列を単にベクトルと見なした)標準内積から得られるノルムになっている。
フロベニウスノルムは劣乗法的である。数値線型代数学において有益であり、またフロベニウスノルムは誘導ノルムより計算が容易なことが多い。
最大ノルム
最大ノルム (max norm) は p = ∞ に対する成分ごとのノルムとして
- [math]\|A\|_{\max}=\max\{|a_{ij}|\}[/math]
で定義される。これは劣乗法的ノルムではない。
シャッテンノルム
シャッテンノルム (Schatten norm) は行列の特異値を並べたベクトルに対するノルムとして得られる。ベクトルノルムに p ノルムを用いるものをシャッテン p ノルムと呼ぶ。行列 A のシャッテン p-ノルムは、A の特異値を σi で表せば、以下のように定義される[注 2]。
- [math]\|A\|_p = \left( \sum_{i=1}^{\min\{m,n\}}\!\!\!\! \sigma_i^p \right)^{\!\!1/p}[/math]
シャッテンノルムはいずれの p に対しても劣乗法的である。また、任意の行列 A のユニタリ変換に対してシャッテンノルムは不変であり[注 3]、任意のユニタリ行列 U, V 対して テンプレート:Norm = テンプレート:Norm が成り立つ。
p = 1, 2, ∞ の場合がよく知られており、p = 2 の場合はフロベニウスノルムが得られる。p = ∞ はスペクトルノルム、すなわちベクトルの 2 ノルムから誘導される行列ノルムである。
トレースノルム
p = 1 からは核型ノルム (nuclear norm)、トレースノルム、あるいは樊畿[注 4](Ky Fan) の n ノルムとして知られるノルム
- [math]\|A\|_{\text{trace}} =\operatorname{tr}(\sqrt{A^*A})= \!\!\!\sum_{i=1}^{\min\{m,n\}} \!\!\!\!\sigma_{i}[/math]
が定まる。ここで行列 A∗ A の平方根は BB = A∗ A を満たす行列 B の意味で用いている。
両立するノルム
空間 Km×n 上の行列ノルム テンプレート:Normab は Kn 上のノルム テンプレート:Norma と Km 上のノルム テンプレート:Normb に対して
- [math]\|Ax\|_b \leq \|A\|_{ab} \|x\|_a[/math]
を満たすとき、テンプレート:Norma, テンプレート:Normb と両立する (consistent) という。テンプレート:Norma, テンプレート:Normb から誘導される作用素ノルムは、その定義から明らかに テンプレート:Norma, テンプレート:Normb と両立する。誘導ノルムをベクトルのノルムと両立する行列ノルムにまで広げても、スペクトル半径が下限を与えるという命題はなお正しい。
ノルムの同値性
有限次元ベクトル空間 Km×n の任意の2つの(ベクトルとしての)ノルム テンプレート:Normα, テンプレート:Normβ に対して、適当な定数 r, s > 0 をとれば
- [math]r\left\|A\right\|_\alpha\leq\left\|A\right\|_\beta\leq s\left\|A\right\|_\alpha[/math]
が任意の行列 A ∈ Km×n に対して成立するようにできる。言い換えれば、このようなノルムはどれも同値 (equivalent) なノルムであり、空間 Km×n に同じ位相を誘導する。
さらに実行列 A ∈ Rn×n の場合、任意のノルム テンプレート:Norm に対し一意な正の定数 k が存在して、kテンプレート:Norm が(劣乗法的な)行列ノルムになる。
行列ノルム テンプレート:Normp は、他のいかなる行列ノルム テンプレート:Normq も テンプレート:Normq ≤ テンプレート:Normp を満たさないとき、極小(英: minimal)であると呼ばれる。
同値なノルムの例
実行列 A ∈ Rn×n に対し、以下の不等式が成立する[1][2]:
- [math]\|A\|_2\le\|A\|_F\le\sqrt{r}\|A\|_2[/math]
- [math]\|A\|_F\le\|A\|_*\le\sqrt{r}\|A\|_F[/math]
- [math]\|A\|_{\max} \le\|A\|_2\le\sqrt{mn}\|A\|_{\max}[/math]
- [math]\frac{1}{\sqrt{n}}\|A\|_\infty\le\|A\|_2\le\sqrt{m}\|A\|_\infty[/math]
- [math]\frac{1}{\sqrt{m}}\|A\|_1\le\|A\|_2\le\sqrt{n}\|A\|_1[/math]
他にも次のような関係は有用である:
- [math]\|A\|_2\le\sqrt{\|A\|_1\|A\|_\infty}[/math]
これはヘルダーの不等式の特殊例である。
注釈
出典
- ↑ Golub & Van Loan 1996, pp. 56-57.
- ↑ Horn & Johnson 1985, Chapter 5.
参考文献
- (1996) Matrix Computations, 3rd, Baltimore: The Johns Hopkins University Press. ISBN 0-8018-5413-X.
- (1985) Matrix Analysis. Cambridge University Press. ISBN 0-521-38632-2.
- Demmel, James W. (1997). Applied Numerical Linear Algebra. Society for Industrial and Applied Mathematics (SIAM). ISBN 0-89871-389-7.
- Meyer, Carl D. (2000). Matrix Analysis and Applied Linear Algebra. Society for Industrial and Applied Mathematics (SIAM).
- Watrous, John (2008), “2.4 Norms of operators”, Theory of Quantum Information, University of Waterloo . 2016-5-28閲覧.