Loewner-Halbordnung

Die Löwner-Halbordnung oder auch Loewner-Halbordnung ist eine spezielle Halbordnung auf dem Vektorraum der symmetrischen reellen n × n {\displaystyle n\times n} -Matrizen, die ihn zum geordneten Vektorraum macht. Sie findet insbesondere in der semidefiniten Programmierung Verwendung, aber auch in der Optimalen Versuchsplanung.

Definition

Gegeben sei der reelle Vektorraum der symmetrischen reellen n × n {\displaystyle n\times n} -Matrizen

S n := { A R n × n | A T = A } . {\displaystyle S^{n}:=\{A\in \mathbb {R} ^{n\times n}\,|\,A^{T}=A\}.}

Hierbei bezeichnet A T {\displaystyle A^{T}} die transponierte Matrix der Matrix A {\displaystyle A} . Man definiert nun die Loewner-Halbordnung L {\displaystyle \geq _{L}} durch

A L 0 A  ist positiv semidefinit  {\displaystyle A\geq _{L}0\iff A{\text{ ist positiv semidefinit }}}

und

A L B A B L 0 A B  ist positiv semidefinit  {\displaystyle A\geq _{L}B\iff A-B\geq _{L}0\iff A-B{\text{ ist positiv semidefinit }}}

sowie

B L A A L B {\displaystyle B\leq _{L}A\iff A\geq _{L}B} .

Alternativ zur Formulierung, dass A {\displaystyle A} eine positiv semidefinite Matrix sein soll, findet sich auch die Forderung, dass x T A x 0 {\displaystyle x^{T}Ax\geq 0} für alle x R n {\displaystyle x\in \mathbb {R} ^{n}} oder aber dass alle Eigenwerte λ i {\displaystyle \lambda _{i}} der Matrix A {\displaystyle A} größergleich null sein sollen. Alle drei Formulierungen sind aber äquivalent.

Konstruktion über einen Ordnungskegel

Alternativ kann man auch den semidefiniten Kegel S + n {\displaystyle S_{+}^{n}} (die Menge alle positiv semidefiniten Matrizen in S n {\displaystyle S^{n}} ) als Ordnungskegel interpretieren. Die von diesem Kegel induzierte Ordnung ist dann die Loewner-Halbordnung.

Konstruktion als verallgemeinerte Ungleichung

Da der semidefinite Kegel sogar ein echter Kegel ist, kann man die von ihm definierte verallgemeinerte Ungleichung betrachten. Sie entspricht wieder der Loewner-Halbordnung.

Beispiel

Wir betrachten die Matrizen

A = ( 12 2 2 8 ) , B = ( 5 1 1 3 ) , C = ( 1 2 2 1 ) {\displaystyle A={\begin{pmatrix}12&2\\2&8\end{pmatrix}},\,B={\begin{pmatrix}5&1\\1&3\end{pmatrix}},\,C={\begin{pmatrix}1&2\\2&-1\end{pmatrix}}} .

Alle drei sind symmetrisch und reell. Eine Berechnung der Eigenwerte oder die Anwendung der Gerschgorin-Kreise liefert, dass sowohl A {\displaystyle A} als auch B {\displaystyle B} positiv definit sind, es ist also

A L 0  und  B L 0 {\displaystyle A\geq _{L}0{\text{ und }}B\geq _{L}0} .

Berechnet man

A B = ( 7 1 1 5 ) {\displaystyle A-B={\begin{pmatrix}7&1\\1&5\end{pmatrix}}} ,

so ist auch diese Matrix positiv definit, da ihre Eigenwerte (nach den Gerschgorin-Kreisen) im Intervall [ 4 , 8 ] {\displaystyle [4,8]} liegen und damit immer positiv sein müssen. Somit ist A L B  bzw.  B L A {\displaystyle A\geq _{L}B{\text{ bzw. }}B\leq _{L}A} .

Bei der Matrix C {\displaystyle C} liefern die Gerschgorin-Kreise keine definitive Aussage, eine Berechnung ergibt die Eigenwerte λ 1 , 2 = ± 5 {\displaystyle \lambda _{1,2}=\pm {\sqrt {5}}} . Somit ist C {\displaystyle C} indefinit, es gilt weder C L 0 {\displaystyle C\geq _{L}0} noch C L 0 {\displaystyle C\leq _{L}0} . Dies liegt daran, dass es sich nur um eine Halbordnung handelt: Zwei Elemente (hier C {\displaystyle C} und die Nullmatrix) müssen nicht notwendigerweise miteinander vergleichbar sein.

Eigenschaften

Da die Loewner-Halbordnung den Vektorraum der reellen symmetrischen Matrizen zu einem geordneten Vektorraum macht, gilt

  • A L A {\displaystyle A\leq _{L}A} für alle A S n {\displaystyle A\in S^{n}} , das heißt, L {\displaystyle \leq _{L}} ist reflexiv.
  • Aus A L B {\displaystyle A\leq _{L}B} und B L C {\displaystyle B\leq _{L}C} folgt A L C {\displaystyle A\leq _{L}C} für alle A , B , C S n {\displaystyle A,B,C\in S^{n}} , das heißt, L {\displaystyle \leq _{L}} ist transitiv.
  • Aus A L B {\displaystyle A\leq _{L}B} folgt A + C L B + C {\displaystyle A+C\leq _{L}B+C} für alle A , B , C S n {\displaystyle A,B,C\in S^{n}} , das heißt, L {\displaystyle \leq _{L}} ist mit der Addition verträglich.
  • Aus A L B {\displaystyle A\leq _{L}B} folgt λ A L λ B {\displaystyle \lambda A\leq _{L}\lambda B} für alle A , B S n {\displaystyle A,B\in S^{n}} und λ [ 0 , ) {\displaystyle \lambda \in [0,\infty )} , das heißt, L {\displaystyle \leq _{L}} ist verträglich mit der Multiplikation mit positiven Skalaren.

Da der semidefinite Kegel ein spitzer Kegel ist, ist L {\displaystyle \leq _{L}} außerdem antisymmetrisch, das heißt, wenn A L B {\displaystyle A\leq _{L}B} und B L A {\displaystyle B\leq _{L}A} , so muss A = B {\displaystyle A=B} sein. Die Loewner-Halbordnung ist also eine strikte Ordnung.

Verwendung

Mittels der Loewner-Halbordnung werden die sogenannten Matrix-monotonen Funktionen definiert. Sie sind genau die monotonen Abbildungen von ( S n , L ) {\displaystyle (S^{n},\leq _{L})} nach ( R , ) {\displaystyle (\mathbb {R} ,\leq )} .

Strikte Varianten

Es lassen sich auch durch

A > 0 A  ist positiv definit  {\displaystyle A>0\iff A{\text{ ist positiv definit }}}

strikte Varianten der Loewner-Halbordnung definieren. Diese tragen aber gewöhnlich keinen Eigennamen.

Notation

Es existiert eine Vielzahl von Notationen für die Loewner-Halbordnung. Gängig sind neben der obigen Notation mittels L {\displaystyle \geq _{L}} unter anderem auch S + n {\displaystyle \succcurlyeq _{S_{+}^{n}}} . Diese wird häufig in der semidefiniten Programmierung genutzt, oder wenn man die Konstruktion als verallgemeinerte Ungleichung verwendet, da sie immer noch mit angibt, welcher Kegel die verallgemeinerte Ungleichung definiert. Selten wird auch auf die Definition eines Ordnungszeichens verzichtet, man schreibt dann zum Beispiel A S + n {\displaystyle A\in -S_{+}^{n}} anstelle von A L 0 {\displaystyle A\leq _{L}0} .

Literatur

  • Johannes Jahn: Introduction to the Theory of Nonlinear Optimization. 3. Auflage. Springer, Berlin 2007, ISBN 978-3-540-49378-5.
  • Florian Jarre, Josef Stoer: Optimierung. Springer, Berlin 2004, ISBN 3-540-43575-1.