ガトー微分

数学におけるガトー微分(ガトーびぶん、: Gâteaux differential, Gâteaux derivative)は、第一次世界大戦において夭折したフランス人数学者ルネ・ガトー(英語版)に名を因む、微分学における方向微分の概念の一般化で、バナハ空間などの局所凸位相線型空間の間の函数に対して定義される。バナハ空間上のフレシェ微分同様に、ガトー微分は変分法物理学で広く用いられる汎函数微分の定式化にしばしば用いられる。

他の微分法と異なり、ガトー微分は必ずしも線型でないが、ガトー微分の定義にそれが連続線型変換となることも仮定することがよくある。文献によっては、例えば Tikhomirov (2001) は(非線型かもしれない)ガトー微分係数 (Gâteaux differential) と(必ず線型である)ガトー導函数 (Gâteaux derivative) をはっきりと区別する。応用に際して、連続線型性がそれぞれの状況において自然に課されるもっと原始的な条件、例えば無限次元正則函数論(英語版)における複素可微分性や非線型解析学における連続的可微分性など、から従うということも多い。

厳密な定義

XY局所凸位相線型空間とし、UX は開集合、 F: XY とするとき、FuU における ψX 方向へのガトー微分係数 dF(u; ψ)

( 1 ) d F ( u ; ψ ) = lim τ 0 F ( u + τ ψ ) F ( u ) τ = d d τ F ( u + τ ψ ) | τ = 0 {\displaystyle (1)\quad dF(u;\psi )=\lim _{\tau \to 0}{\frac {F(u+\tau \psi )-F(u)}{\tau }}=\left.{\frac {d}{d\tau }}F(u+\tau \psi )\right|_{\tau =0}}

として右辺の極限が存在する限りにおいて定める。この極限が任意の ψX に対して存在するとき、Fu においてガトー微分可能 (Gâteaux differentiable) であると言う。

定義式 (1)に現れる極限の取り方は Y の位相と関係する。X および Y がともに位相線型空間ならば、極限は実数 τ に関して取る。一方、X および Y複素位相線型空間ならば上記は複素可微分性の定義におけると同様に複素数平面において τ → 0 とする極限を考えるのが普通である。また強収斂極限の代わりに弱収斂極限を取ることもあり、その場合弱ガトー微分の概念が導かれる。

線型性と連続性

各点 uU においてガトー微分は、函数

d F ( u ; ) : X Y ; ψ d F ( u ; ψ ) {\displaystyle dF(u;\bullet )\colon X\to Y;\;\psi \mapsto dF(u;\psi )}

を定める。この函数は任意のスカラー α に対して

d F ( u ; α ψ ) = α d F ( u ; ψ ) {\displaystyle dF(u;\alpha \psi )=\alpha dF(u;\psi )}

を満たすという意味で斉一次だが、必ずしも加法的でなく、従ってガトー微分係数は線型でないことが起こり得る(この点ではフレシェ微分と異なる)。また、線型となる場合であっても、XY が無限次元の場合には ψ に関して連続とならないことが生じ得る。さらに言えば、線型かつ連続となるようなガトー微分係数に対して、その連続的微分可能性の定式化には互いに同値でないいくつかの方法が存在する。

例えば、二変数の実数値函数 F

F ( x , y ) = { x 3 x 2 + y 2  if  ( x , y ) ( 0 , 0 ) 0  if  ( x , y ) = ( 0 , 0 ) {\displaystyle F(x,y)={\begin{cases}{\dfrac {x^{3}}{x^{2}+y^{2}}}&{\mbox{ if }}(x,y)\neq (0,0)\\0&{\text{ if }}(x,y)=(0,0)\end{cases}}}

で定めると、これは (0, 0) においてガトー微分可能で、その微分係数は

d F ( 0 , 0 ; a , b ) = { a 3 a 2 + b 2 ( a , b ) ( 0 , 0 ) 0 ( a , b ) = ( 0 , 0 ) {\displaystyle dF(0,0;a,b)={\begin{cases}{\dfrac {a^{3}}{a^{2}+b^{2}}}&(a,b)\neq (0,0)\\0&(a,b)=(0,0)\end{cases}}}

となり、しかしこれは引数 (a, b) に関して連続だが線型でない。無限次元の場合、X 上の任意の不連続線型汎函数がガトー微分可能となるが、その 0 におけるガトー微分係数は線型であり、かつ連続でない。

フレシェ微分との関係
Fフレシェ微分可能ならば、F はまたガトー微分可能であり、そのフレシェ導函数とガトー導函数とは一致する。逆が明らかに真でないことは、ガトー導函数が線型や連続でないことがあることから分かるが、実はガトー導函数が線型かつ連続である場合にも、フレシェ導函数が存在しないことがあり得る。
にも拘らず、複素バナハ空間 X から別のバナハ空間 Y への函数 F に対して、ガトー導函数は(ただし、定義における極限は複素変数 τ に関して取るものとすると)、自動的に線型になる(Zorn (1945) の定理)。さらに F が各点 uU において(複素)ガトー微分可能で、その導函数を DF(u): ψ ↦ dF(u; ψ) とすると、FU 上でフレシェ微分可能であり、そのフレシェ導函数は DF になる (Zorn 1946)。このことは、古典的な複素解析において開集合上複素可微分な任意の函数が解析的となるという結果の類似対応物であり、無限次元正則函数論(英語版)の基本的な結果の一つである。
連続的微分可能性
連続的ガトー微分可能性は大きく二つの方法で定義することができる。以下、函数 F: UY は開集合 U の各点でガトー微分可能と仮定する。U における連続的微分可能性の概念の一つは、直積空間上の写像 dF: U × XY連続であることを課すものである。この場合線型性を仮定する必要はなく、XY がともにフレシェ空間ならば dF(u; •) は任意の u に関して自動的に有界かつ線型である (Hamilton 1982)。
より強い意味での連続的微分可能性は uDF(u)U から、X から Y への連続線型写像全体の成す空間 L(x, y) への写像として連続であることを課すものである。即ち、DF: UL(X,Y); uDF(u) の連続性を言う。ここで、DF(u) 自体が連続であることは既に前提としていることに注意。
技術的な便宜上、X, Y がバナハ空間であるときは、後者の意味での連続的微分可能性を考えるのが典型的(だがいつも (universal) というわけではない)である。これは L(X, Y) もまたバナハであり、従って函数解析学における標準的な結果をそこで用いることができるという理由による。前者のほうは、非線型解析ではより一般的に用いられる定義であり、この分野では函数空間は必ずしもバナハでない。例えば、フレシェ空間における微分法(英語版)は、しばしば可微分多様体上の滑らかな函数からなる意味のある函数空間において、ナッシュ-モーザーの逆写像定理(英語版)などで応用される。


高階導函数

高階のフレシェ導函数が、同型 Ln(X, Y) = L(X, Ln−1(X, Y)) の反復適用によって、多重線型写像として自然に定義されるのに反して、高階ガトー導函数はこの方法で定義することはできない。その代わり、X の開集合 U 上の函数 F: UYh-方向への n-階ガトー導函数は

(2) d n F ( u ; h ) = d n d τ n F ( u + τ h ) | τ = 0 {\displaystyle d^{n}F(u;h)=\left.{\frac {d^{n}}{d\tau ^{n}}}F(u+\tau h)\right|_{\tau =0}}

で定義される。つまりこれは、多重線型写像ではなくて、h に関する n-次の斉次函数になる。

あるいはまた、少なくとも F がスカラー値函数である特別の場合には、高階導函数の別な候補として、F の二次変分としての函数

(3) D 2 F ( u ) { h , k } = lim τ 0 D F ( u + τ k ) h D F ( u ) h τ = 2 τ σ F ( u + σ h + τ k ) | τ = σ = 0 {\displaystyle D^{2}F(u)\{h,k\}=\lim _{\tau \to 0}{\frac {DF(u+\tau k)h-DF(u)h}{\tau }}=\left.{\frac {\partial ^{2}}{\partial \tau \partial \sigma }}F(u+\sigma h+\tau k)\right|_{\tau =\sigma =0}}

が、変分法において自然に生じてくるが、しかしこの方法だと h および k のそれぞれに関して斉次になることを除けば、まともな性質が全く保証されない。D2F(u){h, k}hk に関する対称双線型写像となること、およびその対称双線型写像が dnF極化形式(英語版)と一致すること、を保証する十分条件を持つことが望ましい。

例えば、以下のような十分条件が挙げられる (Hamilton 1982)。F は写像 DF: U × XY が積位相に関して連続であるという意味で C1-級であるとし、さらに定義式 (3) の定める二次変分が D2F: U × X × XY が連続となるという意味で連続と仮定する。このとき D2F(u){h, k}h, k に関して双線型かつ対称である。双線型性のおかげで、極化恒等式

D 2 F ( u ) { h , k } = 1 2 d 2 F ( u ; h + k ) d 2 F ( u ; h ) d 2 F ( u ; k ) {\displaystyle D^{2}F(u)\{h,k\}={\frac {1}{2}}d^{2}F(u;h+k)-d^{2}F(u;h)-d^{2}F(u;k)}

が満たされ、二次変分 D2F(u) が二次微分係数 d2F(u; −) に関連付けられる。同様のことが高階導函数に関しても成立する。

性質

函数 F が十分に連続的微分可能と仮定すると、F のガトー微分に関して微分積分学の基本定理の一種が成立する。具体的に書けば、

F: XY はガトー微分 dF: U × XY が連続函数であるという意味で C1-級とすると、任意の uU および hX に関して
F ( u + h ) F ( u ) = 0 1 d F ( u + t h ; h ) d t {\displaystyle F(u+h)-F(u)=\int _{0}^{1}dF(u+th;h)\,dt}
が成り立つ。ただし、積分はゲルファント-ペティス積分(弱積分)の意味で取る。

これにより、よく知られた微分の性質の多くをガトー微分も満たす(例えば、高階導函数の重線型性や交換性)。基本定理の帰結として他にも、

連鎖律
任意の uU , xX に対して d ( G F ) ( u ; x ) = d G ( F ( u ) ; d F ( u ; x ) ) {\displaystyle d(G\circ F)(u;x)=dG(F(u);dF(u;x))} が成り立つ。
剰余項を持つテイラーの定理
uUu + h を結ぶ線分がまったく U に含まれると仮定する。FCk-級ならば
F ( u + h ) = F ( u ) + d F ( u ; h ) + 1 2 ! d 2 F ( u ; h ) + + 1 ( k 1 ) ! d k 1 F ( u ; h ) + R k {\displaystyle F(u+h)=F(u)+dF(u;h)+{\frac {1}{2!}}d^{2}F(u;h)+\dots +{\frac {1}{(k-1)!}}d^{k-1}F(u;h)+R_{k}}
が成り立つ。ただし剰余項は
R k ( u ; h ) = 1 ( k 1 ) ! 0 1 ( 1 t ) k 1 d k F ( u + t h ; h ) d t {\displaystyle R_{k}(u;h)={\frac {1}{(k-1)!}}\int _{0}^{1}(1-t)^{k-1}d^{k}F(u+th;h)\,dt}
で与えられる。

などが成立する。

空間 Xユークリッド空間 RNルベーグ可測集合 Ω 上の自乗可積分函数全体の成すヒルベルト空間とする。FF' = f なる実変数実数値函数で、uΩ 上の実数値函数とするとき、汎函数 E: XR

E ( u ) = Ω F ( u ( x ) ) d x {\displaystyle E(u)=\int _{\Omega }F(u(x))dx}

で定めると、これはガトー導函数

d E ( u , ψ ) = f ( u ) , ψ {\displaystyle dE(u,\psi )=\langle f(u),\psi \rangle }

を持つ。実際、

E ( u + τ ψ ) E ( u ) τ = 1 τ ( Ω F ( u + τ ψ ) d x Ω F ( u ) d x ) = 1 τ ( Ω 0 1 d d s F ( u + s τ ψ ) d s d x ) = Ω 0 1 f ( u + s τ ψ ) ψ d s d x {\displaystyle {\begin{aligned}{\frac {E(u+\tau \psi )-E(u)}{\tau }}&={\frac {1}{\tau }}\left(\int _{\Omega }F(u+\tau \psi )dx-\int _{\Omega }F(u)dx\right)\\&={\frac {1}{\tau }}\left(\int _{\Omega }\int _{0}^{1}{\frac {d}{ds}}F(u+s\tau \psi )\,ds\,dx\right)\\&=\int _{\Omega }\int _{0}^{1}f(u+s\tau \psi )\psi \,ds\,dx\end{aligned}}}

となるから、τ → 0 としてガトー導函数は

d E ( u , ψ ) = Ω f ( u ( x ) ) ψ ( x ) d x , {\displaystyle dE(u,\psi )=\int _{\Omega }f(u(x))\psi (x)\,dx,}

即ち、内積 f, ψ となる。

参考文献

  • Gâteaux, R (1913), “Sur les fonctionnelles continues et les fonctionnelles analytiques”, Comptes rendus hebdomadaires des séances de l'Académie des sciences (Paris) 157: 325–327, http://gallica.bnf.fr/ark:/12148/bpt6k31103/f325.image 2012年9月2日閲覧。 .
  • Gâteaux, R (1919), “Fonctions d'une infinité de variables indépendantes”, Bulletin de la Société Mathématique de France 47: 70–96, http://www.numdam.org:80/numdam-bin/item?id=BSMF_1919__47__70_1 .
  • Hamilton, R. S. (1982), “The inverse function theorem of Nash and Moser”, Bull. AMS. 7 (1): 65–222, doi:10.1090/S0273-0979-1982-15004-2, MR656198, http://projecteuclid.org/euclid.bams/1183549049 
  • Hille, Einar; Phillips, Ralph S. (1974), Functional analysis and semi-groups, Providence, R.I.: American Mathematical Society, MR0423094 .
  • Tikhomirov, V.M. (2001), “Gâteaux variation”, in Hazewinkel, Michiel, Encyclopedia of Mathematics, Springer, ISBN 978-1-55608-010-4, https://www.encyclopediaofmath.org/index.php?title=Gâteaux_variation .
  • Zorn, Max (1945), “Characterization of analytic functions in Banach spaces”, Annals of Mathematics. Second Series 46 (4): 585–593, doi:10.2307/1969198, ISSN 0003-486X, JSTOR 1969198, MR0014190, https://jstor.org/stable/1969198 .
  • Zorn, Max (1946), “Derivatives and Frechet differentials”, Bulletin of the American Mathematical Society 52 (2): 133–137, doi:10.1090/S0002-9904-1946-08524-9, MR0014595, http://www.ams.org/bull/1946-52-02/S0002-9904-1946-08524-9/home.html .

関連項目