Multiplicadors de Lagrange

Fig. 1. En verd, el lloc geomètric (corba de nivell o isolínia) dels punts que satisfan la restricció g(x,y) = c. En blau els contorns de f. Les fletxes representen el gradient, que té una direcció perpendicular a la tangent de la isolínia.

En problemes d'optimització matemàtica, el mètode dels multiplicadors de Lagrange, anomenat així per Joseph Louis Lagrange, és un mètode per trobar l'extrem d'una funció de diverses variables subjecte a una o més restriccions; és l'eina bàsica en l'optimització no lineal amb restriccions.

Simplificant, aquesta tècnica permet determinar a quin lloc d'un conjunt particular de punts (com una esfera, un cercle o un pla) es troba l'extrem d'una funció donada. La tècnica aplica una generalització i formalització del fet que el conjunt de tots els punts a alçada h sobre la superfície de la terra és un conjunt tangent al cim d'una muntanya d'alçada h.

Més formalment, els multiplicadors de Lagrange calculen els punts estacionaris de la funció restringida. En virtut del teorema de Fermat, els extrems es troben en aquests punts, o bé en els límits, o bé en punts on la funció no és diferenciable.

Redueix el trobar els punts estacionaris d'una funció restringida d'n variables amb k restriccions a trobar els punts estacionaris d'una funció no restringida d'n+k variables. El mètode introdueix una variable escalar desconeguda nova (anomenada multiplicador de Lagrange) per a cada restricció, i defineix una funció nova (anomenada Lagrangià) en termes de la funció original, les restriccions, i els multiplicadors Lagrange.

Introducció

Considereu un cas bidimensional. Suposeu una funció f ( x , y ) {\displaystyle f(x,y)} que cal maximitzar subjecte a la restricció

g ( x , y ) = c , {\displaystyle g\left(x,y\right)=c,}

on c és una constant. Es poden visualitzar les isolínies de f {\displaystyle f} donades per

f ( x , y ) = d n {\displaystyle f\left(x,y\right)=d_{n}}

per a diversos valors de d n {\displaystyle d_{n}} , i la isolínia de g {\displaystyle g} donada per g ( x , y ) = c {\displaystyle g(x,y)=c} .

Considereu el recorregut al llarg de la isolínia g = c {\displaystyle g=c} . En general les corbes de nivell de f {\displaystyle f} i g {\displaystyle g} poden ser diferents, la trajectòria de la isolínia g = c {\displaystyle g=c} pot intersectar o encreuar-se amb les isolínies f {\displaystyle f} . Això equival a dir que al llarg del recorregut de g = c {\displaystyle g=c} el valor de f {\displaystyle f} pot variar. Només quan la isolínia g = c {\displaystyle g=c} toca tangencialment la isolínia f {\displaystyle f} , ni augmenta ni disminueix el valor de f {\displaystyle f} , és a dir, que es toquen però no es creuen.

Això succeeix exactament quan la component tangencial de la derivada total s'anul·la: d f = 0 {\displaystyle df_{\parallel }=0} , cosa que es dona als punts estacionaris restringits de f {\displaystyle f} (que inclou els extrems locals restringits, assumint que f {\displaystyle f} és diferenciable). Computacionalment, això passa quan el pendent de f {\displaystyle f} és normal a la restricció: quan f = λ g {\displaystyle \nabla f=\lambda \nabla g} per alguns escalars λ {\displaystyle \lambda } .

Un exemple familiar es pot obtenir dels mapes meteorològics, amb les seves isolínies per a temperatura (isotermes) i pressió (isòbares): els extrems restringits són els punts on, superposant els mapes, les línies es toquen (isopletes).

La condició de tangència s'expressa geomètricament dient que els gradients de f {\displaystyle f} i de g {\displaystyle g} són vectors paral·lels en els màxims, ja que els pendents són sempre normals a les isolínies. Per tant, la solució del problema són punts ( x , y ) {\displaystyle (x,y)} on x , y f = λ x , y g {\displaystyle \nabla _{x,y}f=\lambda \nabla _{x,y}g} i, a més, g ( x , y ) = c {\displaystyle g(x,y)=c} . Per tal d'incorporar aquestes dues condicions a una equació, s'introdueix un escalar desconegut, λ {\displaystyle \lambda } , i es resol

x , y , λ F ( x , y , λ ) = 0 {\displaystyle \nabla _{x,y,\lambda }F\left(x,y,\lambda \right)=0}

amb

F ( x , y , λ ) = f ( x , y ) λ ( g ( x , y ) c ) , {\displaystyle F\left(x,y,\lambda \right)=f\left(x,y\right)-\lambda \left(g\left(x,y\right)-c\right),}

i

x , y , λ = ( x , y , λ ) . {\displaystyle \nabla _{x,y,\lambda }=\left({\frac {\partial }{\partial x}},{\frac {\partial }{\partial y}},{\frac {\partial }{\partial \lambda }}\right).}

Justificació

Com s'ha dit més amunt, es volen trobar punts estacionaris de f {\displaystyle f} d'entre els punts del conjunt g ( x , y ) = c {\displaystyle g(x,y)=c} . Això succeeix només quan el pendent de f {\displaystyle f} no té component tangencial a les isolínies g {\displaystyle g} . Aquesta condició es pot escriure com x , y f ( x , y ) = λ x , y g ( x , y ) {\displaystyle \nabla _{x,y}f(x,y)=\lambda \nabla _{x,y}g(x,y)} per a algun valor de λ {\displaystyle \lambda } . Els punts estacionaris ( x , y , λ ) {\displaystyle (x,y,\lambda )} de F {\displaystyle F} també satisfan g ( x , y ) = c {\displaystyle g(x,y)=c} com es pot comprovar considerant la derivada respecte de λ {\displaystyle \lambda } .

Advertència: diferència entre extrems i punts estacionaris

Cal tenir present que les solucions són els punts estacionaris del Lagrangià F {\displaystyle F} , que inclou els punts de sella: no són necessàriament extrems de F {\displaystyle F} . F {\displaystyle F} no té límits: donat un punt ( x , y ) {\displaystyle (x,y)} que no és sobre la restricció, fent λ ± {\displaystyle \lambda \to \pm \infty } fa F {\displaystyle F} arbitràriament gran o petit. Tanmateix, com s'explica més endavant, sota hipòtesis més fortes el principi fort del Lagrangià diu que els màxims de f {\displaystyle f} maximitzen el Lagrangià globalment.

Formulació general: El principi feble del Lagrangià

Sigui la funció objectiu f ( x ) {\displaystyle f(\mathbf {x} )} i les restriccions g k ( x ) = 0 {\displaystyle g_{k}(\mathbf {x} )=0} , passant les constants a l'esquerra de la igualtat, com a h k ( x ) c k = g k ( x ) {\displaystyle h_{k}(\mathbf {x} )-c_{k}=g_{k}(\mathbf {x} )} . El domini de f hauria de ser un conjunt obert que contingui tots els punts que satisfan les restriccions. A més, f {\displaystyle f} i les restriccions g k {\displaystyle g_{k}} han de tenir les primeres derivades parcials contínues i els gradients de les g k {\displaystyle g_{k}} han de ser no nul·les en el domini.[1] Aleshores es defineix el Lagrangià, Λ {\displaystyle \Lambda } , com

Λ ( x , λ ) = f + k λ k g k . {\displaystyle \Lambda (\mathbf {x} ,{\boldsymbol {\lambda }})=f+\sum _{k}\lambda _{k}g_{k}.}
k {\displaystyle k} és un índex per a variables i funcions associades a una restricció particular, k {\displaystyle k} .
λ {\displaystyle \mathbf {\lambda } } sense subíndex indica el vector d'elements λ k {\displaystyle \mathbf {\lambda } _{k}} , que es consideren variables independents.

Observeu que tant els criteris d'optimització com les restriccions g k ( x ) {\displaystyle g_{k}(x)} es codifiquen compactament com punts estacionaris del Lagrangià:

x Λ = 0 {\displaystyle \nabla _{\mathbf {x} }\Lambda =\mathbf {0} } si i només si x f = k λ k x g k , {\displaystyle \nabla _{\mathbf {x} }f=-\sum _{k}\lambda _{k}\nabla _{\mathbf {x} }g_{k},}
x {\displaystyle \nabla _{\mathbf {x} }} és el pendent respecte de cada element del vector x {\displaystyle \mathbf {x} } , en comptes de totes les variables.

i

λ Λ = 0 {\displaystyle \nabla _{\mathbf {\lambda } }\Lambda =\mathbf {0} } implica g k = 0. {\displaystyle g_{k}=0.}

Els punts estacionaris del Lagrangià

Λ = 0 {\displaystyle \nabla \Lambda =\mathbf {0} } ,

donen conjuntament tantes equacions úniques com el nombre de x {\displaystyle \mathbf {x} } més el nombre de λ {\displaystyle \mathbf {\lambda } } . Això fa sovint possible resoldre tots els x {\displaystyle x} i λ k {\displaystyle \lambda _{k}} , sense invertir g k {\displaystyle g_{k}} .[1] Per aquesta raó, el mètode dels multiplicador de Lagrange pot ser útil en situacions on és més fàcil trobar les derivades de les restriccions que invertir-les.

Sovint els multiplicadors de Lagrange es poden interpretar com alguna quantitat principal d'interès. Per entendre de quina manera això és possible, observeu que:

Λ g k = λ k . {\displaystyle {\frac {\partial \Lambda }{\partial {g_{k}}}}=\lambda _{k}.}

Així, λk és la taxa de variació de la quantitat que es vol optimitzar respecte de la variable de restricció. Per exemple, en Mecànica Lagrangiana les equacions del moviment es dedueixen trobant punts estacionaris de l'acció, la integral temporal de la diferència entre energia cinètica i energia potencial. Així, la força sobre una partícula deguda a un potencial escalar, F = −∇V, pot ser interpretada com un multiplicador de Lagrange que determina el canvi en acció (transformació d'energia potencial en energia cinètica) deguda a una variació en la trajectòria restringida de la partícula. En economia, el benefici òptim d'una part es calcula subjecte a un espai restringit d'accions, on un multiplicador de Lagrange és el valor d'alliberar una restricció donada (p. ex. a través del suborn o altres mitjans).

El mètode de les Condicions de Karush-Kuhn-Tucker és la generalització del mètode dels multiplicadors de Lagrange.

Exemples

Exemple molt senzill

Fig. 2. Il·lustració del problema d'optimització restringida.

Es desitja maximitzar f ( x , y ) = x + y {\displaystyle f(x,y)=x+y} subjecte a la restricció x 2 + y 2 = 1 {\displaystyle x^{2}+y^{2}=1} . La restricció és el cercle de radi unitat, i les isolínies de f són línies diagonals (de pendent -1), així un pot veure gràficament que el màxim es dona a ( 2 / 2 , 2 / 2 ) {\displaystyle ({\sqrt {2}}/2,{\sqrt {2}}/2)} (i el mínim es dona a ( 2 / 2 , 2 / 2 ) {\displaystyle (-{\sqrt {2}}/2,-{\sqrt {2}}/2)} )

Formalment, sigui g ( x , y ) = x 2 + y 2 1 {\displaystyle g(x,y)=x^{2}+y^{2}-1} , i

Λ ( x , y , λ ) = f ( x , y ) + λ g ( x , y ) = x + y + λ ( x 2 + y 2 1 ) {\displaystyle \Lambda (x,y,\lambda )=f(x,y)+\lambda g(x,y)=x+y+\lambda (x^{2}+y^{2}-1)}

Sigui la derivada d Λ = 0 {\displaystyle d\Lambda =0} , que produeix el sistema d'equacions:

Λ x = 1 + 2 λ x = 0 , (i) Λ y = 1 + 2 λ y = 0 , (ii) Λ λ = x 2 + y 2 1 = 0 , (iii) {\displaystyle {\begin{aligned}{\frac {\partial \Lambda }{\partial x}}&=1+2\lambda x&&=0,\qquad {\text{(i)}}\\{\frac {\partial \Lambda }{\partial y}}&=1+2\lambda y&&=0,\qquad {\text{(ii)}}\\{\frac {\partial \Lambda }{\partial \lambda }}&=x^{2}+y^{2}-1&&=0,\qquad {\text{(iii)}}\end{aligned}}}

Com sempre, l'equació λ {\displaystyle \partial \lambda } és la restricció original.

Combinant les dues primeres equacions s'obté x = y {\displaystyle x=y} (explícitament, x 0 {\displaystyle x\neq 0} (si no, l'equació (i) donaria 1 = 0), així es pot resoldre per λ {\displaystyle \lambda } , que dona λ = 1 / ( 2 x ) {\displaystyle \lambda =-1/(2x)} , que es pot substituir a (ii)).

Substituint a (iii) dona 2 x 2 = 1 {\displaystyle 2x^{2}=1} , així x = ± 2 / 2 {\displaystyle x=\pm {\sqrt {2}}/2} i els punts estacionaris són ( 2 / 2 , 2 / 2 ) {\displaystyle ({\sqrt {2}}/2,{\sqrt {2}}/2)} i ( 2 / 2 , 2 / 2 ) {\displaystyle (-{\sqrt {2}}/2,-{\sqrt {2}}/2)} . Avaluant-hi la funció objectiu f dona

f ( 2 / 2 , 2 / 2 ) = 2  and  f ( 2 / 2 , 2 / 2 ) = 2 , {\displaystyle f({\sqrt {2}}/2,{\sqrt {2}}/2)={\sqrt {2}}{\mbox{ and }}f(-{\sqrt {2}}/2,-{\sqrt {2}}/2)=-{\sqrt {2}},}

Així, el màxim és 2 {\displaystyle {\sqrt {2}}} , que s'assoleix a ( 2 / 2 , 2 / 2 ) {\displaystyle ({\sqrt {2}}/2,{\sqrt {2}}/2)} , i el mínim és 2 {\displaystyle -{\sqrt {2}}} , que s'assoleix a ( 2 / 2 , 2 / 2 ) {\displaystyle (-{\sqrt {2}}/2,-{\sqrt {2}}/2)} .

Exemple senzill

Es vol trobar els valors màxims de

f ( x , y ) = x 2 y {\displaystyle f(x,y)=x^{2}y\,}

amb la condició que les coordenades x i y romanguin dins el cercle de radi √3 centrat a l'origen, és a dir

x 2 + y 2 = 3. {\displaystyle x^{2}+y^{2}=3.\,}

Com que només hi ha una condició, s'utilitza només un multiplicador, λ.

A partir de la restricció, es defineix la funció g(x, y):

g ( x , y ) = x 2 + y 2 3. {\displaystyle g(x,y)=x^{2}+y^{2}-3.\,}

La funció g és idènticament zero sobre el cercle de radi 3. Així, es pot sumar qualsevol múltiple de g(x, y) a f(x, y) deixant inalterada f(x, y) a la regió d'interès (damunt el cercle on se satisfà la restricció original). Siguin

Λ ( x , y , λ ) = f ( x , y ) + λ g ( x , y ) = x 2 y + λ ( x 2 + y 2 3 ) . {\displaystyle \Lambda (x,y,\lambda )=f(x,y)+\lambda g(x,y)=x^{2}y+\lambda (x^{2}+y^{2}-3).\,}

Els valors crítics de Λ {\displaystyle \Lambda } tenen lloc on el seu gradient és zero. Les derivades parcials són

Λ x = 2 x y + 2 λ x = 0 , (i) Λ y = x 2 + 2 λ y = 0 , (ii) Λ λ = x 2 + y 2 3 = 0. (iii) {\displaystyle {\begin{aligned}{\frac {\partial \Lambda }{\partial x}}&=2xy+2\lambda x&&=0,\qquad {\text{(i)}}\\{\frac {\partial \Lambda }{\partial y}}&=x^{2}+2\lambda y&&=0,\qquad {\text{(ii)}}\\{\frac {\partial \Lambda }{\partial \lambda }}&=x^{2}+y^{2}-3&&=0.\qquad {\text{(iii)}}\end{aligned}}}


L'equació (iii) és la restricció original. L'equació (i) implica x = 0 {\displaystyle x=0} o λ = −y. En el primer cas, si x = 0 {\displaystyle x=0} aleshores es compleix y = ± 3 {\displaystyle y=\pm {\sqrt {3}}} mitjançant (iii) i llavors mitjançant (ii) λ=0. En el segon cas, si λ = −y i substituint a l'equació (ii) tenim que,

x 2 2 y 2 = 0. {\displaystyle x^{2}-2y^{2}=0.\,}

Llavors x² = 2y². Substituint a l'equació (iii) i resolent per y dona el valor de y:

y = ± 1. {\displaystyle y=\pm 1.\,}

Hi ha clarament sis punts crítics:

( 2 , 1 ) ; ( 2 , 1 ) ; ( 2 , 1 ) ; ( 2 , 1 ) ; ( 0 , 3 ) ; ( 0 , 3 ) . {\displaystyle ({\sqrt {2}},1);\quad (-{\sqrt {2}},1);\quad ({\sqrt {2}},-1);\quad (-{\sqrt {2}},-1);\quad (0,{\sqrt {3}});\quad (0,-{\sqrt {3}}).}

Avaluant l'objectiu en aquests punts, tenim

f ( ± 2 , 1 ) = 2 ; f ( ± 2 , 1 ) = 2 ; f ( 0 , ± 3 ) = 0. {\displaystyle f(\pm {\sqrt {2}},1)=2;\quad f(\pm {\sqrt {2}},-1)=-2;\quad f(0,\pm {\sqrt {3}})=0.}

Per tant, la funció objectiu assoleix un màxim global (respecte de les restriccions) a ( ± 2 , 1 ) {\displaystyle (\pm {\sqrt {2}},1)} i un mínim global a ( ± 2 , 1 ) . {\displaystyle (\pm {\sqrt {2}},-1).} El punt ( 0 , 3 ) {\displaystyle (0,{\sqrt {3}})} és un mínim local i ( 0 , 3 ) {\displaystyle (0,-{\sqrt {3}})} és un màxim local.

Exemple: entropia

Es vol trobar la distribució discreta de probabilitat amb màxima entropia d'informació. Llavors

f ( p 1 , p 2 , , p n ) = k = 1 n p k log 2 p k . {\displaystyle f(p_{1},p_{2},\ldots ,p_{n})=-\sum _{k=1}^{n}p_{k}\log _{2}p_{k}.}

Naturalment, la suma d'aquestes probabilitats és igual a 1, per tant la restricció és g(p) = 1 amb

g ( p 1 , p 2 , , p n ) = k = 1 n p k . {\displaystyle g(p_{1},p_{2},\ldots ,p_{n})=\sum _{k=1}^{n}p_{k}.}

Es poden utilitzar multiplicadors de Lagrange per trobar el punt de màxima entropia (depenent de les probabilitats). Per a qualsevol k des d'1 a n, cal que

p k ( f + λ ( g 1 ) ) = 0 , {\displaystyle {\frac {\partial }{\partial p_{k}}}(f+\lambda (g-1))=0,}

que resulta

p k ( k = 1 n p k log 2 p k + λ ( k = 1 n p k 1 ) ) = 0. {\displaystyle {\frac {\partial }{\partial p_{k}}}\left(-\sum _{k=1}^{n}p_{k}\log _{2}p_{k}+\lambda \left(\sum _{k=1}^{n}p_{k}-1\right)\right)=0.}

Fent la diferenciació d'aquestes n equacions, s'arriba a


( 1 ln 2 + log 2 p k ) + λ = 0. {\displaystyle -\left({\frac {1}{\ln 2}}+\log _{2}p_{k}\right)+\lambda =0.}

Això mostra que tots els pi són iguals (perquè només depenen de λ). Utilitzant la restricció ∑k pk = 1, s'arriba a

p k = 1 n . {\displaystyle p_{k}={\frac {1}{n}}.}

Per això, la distribució uniforme és la distribució amb l'entropia més gran.

Economia

L'optimització restringida té un paper central a l'economia. Per exemple, el problema d'elecció per un consumidor es representa com el problema de maximitzar una funció utilitat subjecte a una restricció pressupostària. El multiplicador de Lagrange té la interpretació econòmica del preu ombra associat a la restricció, en aquest cas la utilitat marginal d'ingressos.

El principi fort del Lagrangià: dualitat de Lagrange

Donat un problema d'optimització convexa en forma canònica

es minimitza f 0 ( x ) {\displaystyle f_{0}(x)} subjecte a

f i ( x ) 0 ,   i { 1 , , m } {\displaystyle f_{i}(x)\leq 0,\ i\in \left\{1,\dots ,m\right\}}
h i ( x ) = 0 ,   i { 1 , , p } {\displaystyle h_{i}(x)=0,\ i\in \left\{1,\dots ,p\right\}}

tenint el domini D R n {\displaystyle {\mathcal {D}}\subset \mathbb {R} ^{n}} amb interior no buit, la funció Lagrangiana L : R n × R m × R p R {\displaystyle L:\mathbb {R} ^{n}\times \mathbb {R} ^{m}\times \mathbb {R} ^{p}\to \mathbb {R} } es defineix com

L ( x , λ , ν ) = f 0 ( x ) + i = 1 m λ i f i ( x ) + i = 1 p ν i h i ( x ) . {\displaystyle L(x,\lambda ,\nu )=f_{0}(x)+\sum _{i=1}^{m}\lambda _{i}f_{i}(x)+\sum _{i=1}^{p}\nu _{i}h_{i}(x).}

Els vectors λ {\displaystyle \lambda } i ν {\displaystyle \nu } són anomenats les variables duals o vectors del multiplicador Lagrange associat al problema. La funció dual de Lagrange g : R m × R p R {\displaystyle g:\mathbb {R} ^{m}\times \mathbb {R} ^{p}\to \mathbb {R} } es defineix com

g ( λ , ν ) = inf x D L ( x , λ , ν ) = inf x D ( f 0 ( x ) + i = 1 m λ i f i ( x ) + i = 1 p ν i h i ( x ) ) . {\displaystyle g(\lambda ,\nu )=\inf _{x\in {\mathcal {D}}}L(x,\lambda ,\nu )=\inf _{x\in {\mathcal {D}}}\left(f_{0}(x)+\sum _{i=1}^{m}\lambda _{i}f_{i}(x)+\sum _{i=1}^{p}\nu _{i}h_{i}(x)\right).}

La funció dual g {\displaystyle g} és còncava, àdhuc quan el problema inicial és no convex. La funció dual produeix fites inferiors de l'òptim p {\displaystyle p^{*}} del problema inicial; per a qualsevol λ 0 {\displaystyle \lambda \geq 0} i qualsevol ν {\displaystyle \nu } tenim g ( λ , ν ) p {\displaystyle g(\lambda ,\nu )\leq p^{*}} . Si es compleix el requisit d'una restricció com la Condició de Slater i el problema original és convex, llavors tenim dualitat forta, és a dir que d = max g ( λ , ν ) = inf f 0 = p ( x ) {\displaystyle d^{*}=\max g(\lambda ,\nu )=\inf f_{0}=p^{*}(x)} .

Vegeu també

Referències

  1. 1,0 1,1 Weisstein, Eric W., «Lagrange Multiplier» a MathWorld (en anglès).

Enllaços externs

  • Conceptual Introduction (més una breu discussió dels multiplicadors de Lagrange en el càlcul de variacions com s'utilitzen en física) (anglès)
  • Multiplicadors de Lagrange sense marcat permanent (tutorial de Dan Klein) (anglès)
  • Explicació senzilla amb un exemple de governs emprant impostos com a multiplicadors de Lagrange (anglès)