Economía
Escrito por Juan E. Martínez Legaz   
domingo, 08 de abril de 2007
La interpretación económica de los multiplicadores de Lagrange

Recibido: jueves, 17 agosto 2006




La interpretación económica de los multiplicadores de Lagrange


Juan Enrique Martínez Legaz 

Departament d'Economia i d'Història Econòmica

Universitat Autònoma de Barcelona

e-mail: Esta dirección de correo electrónico está protegida contra los robots de spam, necesita tener Javascript activado para poder verla   

página web: http://selene.uab.es/_cs_u_fonaments/fitxes/mlegaz.htm

 

 

Pinche sobre una fórmula para ampliarla. Vuelva a pinchar sobre ella para reducirla, o pinche manteniendo pulsada la tecla [shift] para reducir todas las que permanezcan ampliadas.

 

Introducción

 

El teorema de los multiplicadores de Lagrange es el instrumento teórico más clásico, y el primero desde el punto de vista histórico, para resolver problemas de optimización con restricciones. Su creador, Joseph-Louis Lagrange (Turín, 1736 – París, 1813), utilizó por primera vez la técnica de los multiplicadores para resolver problemas del cálculo de variaciones en su célebre tratado Méchanique Analitique [5], en el cual dotó a la Mecánica de un formalismo analítico adecuado, y posteriormente lo expuso en su no menos célebre obra sobre cálculo diferencial [6]. El teorema en cuestión, bien conocido, trata de la maximización (o minimización) de una función de varias variables, , bajo restricciones de igualdad   Suponiendo que tanto la función objetivo como las restricciones son continuamente diferenciables en un óptimo local  del problema y que la matriz jacobiana  tiene rango , el teorema establece la existencia de , llamados multiplicadores de Lagrange, tales que

 

 

(1)

 

siendo  la denominada función lagrangiana, definida por

 

 

(2)

 

La demostración más habitual de este resultado se basa en el teorema de la función implícita.

 

Obsérvese que (1) puede escribirse, equivalentemente,

                                                                                                                                         

 

(3)

 

el símbolo  denota aquí gradiente.

 

El uso típico que se hace del teorema de los multiplicadores de Lagrange en los cursos de Análisis Matemático para la resolución de problemas de optimización con restricciones de igualdad consiste en plantear el sistema formado por las  ecuaciones (1) y las  restricciones en las  incógnitas  para buscar candidatos  a óptimo local. El papel que juegan los multiplicadores de Lagrange en este planteamiento se reduce al de meras variables auxiliares, carentes de todo interés intrínseco salvo el de hacer posible el cálculo de potenciales óptimos locales. Sin embargo, los multiplicadores de Lagrange poseen un importante significado matemático, que resulta especialmente relevante en problemas de tipo económico. El principal objetivo de este artículo es precisamente poner de manifiesto ese significado.

 

 

Una “pseudodemostración” del teorema de los multiplicadores de Lagrange

 

Empezaremos presentando una “pseudodemostración” del teorema de los multiplicadores de Lagrange, que, además de ser muy simple, proporciona directamente la interpretación de los multiplicadores. Consideraremos el problema de maximización y, asociado a él, la función  denominada función valor o función valor óptimo, definida por

 

 

 

Se trata de una función a valores en la recta real extendida, pues puede tomar los valores  (cuando la función objetivo  no está acotada superiormente sobre el conjunto definido por las restricciones) y  (si ese conjunto de soluciones admisibles es vacío). Obsérvese que nuestro problema de maximización (que supondremos global, para simplificar la exposición) equivale a encontrar un punto  tal que

 

 

 

Consideremos la función auxiliar  definida por

 

 

(4)

 

Es fácil ver que  para todo  y que  si  es un máximo global de nuestro problema. Por tanto,  es también un máximo global de ; en consecuencia, si suponemos no sólo que las funciones  son continuamente diferenciables en  sino también que  lo es en  (es precisamente este supuesto lo que confiere a esta argumentación el carácter de pseudodemostración en lugar de demostración rigurosa), aplicando la condición necesaria de primer orden para extremos locales obtenemos que  . Tomando gradientes en (4) se llega, pues, a la conclusión de que

 

 

 

Sólo falta observar que estas condiciones son idénticas a (3) si se toma

 

 

(5)

 

De esta manera no sólo hemos “demostrado” la existencia de los multiplicadores de Lagrange, sino que también hemos visto su auténtico significado: son las derivadas parciales de la función valor con respecto de los segundos miembros de las restricciones, es decir, miden la tasa de variación del valor óptimo del problema en relación a pequeños cambios en los segundos miembros. Aunque, por simplicidad, nuestra pseudodemostración se ha referido al problema de optimización global, una interpretación análoga de los multiplicadores de Lagrange es asimismo válida en el caso de extremos locales, e incluso en el caso más general de puntos que satisfacen las condiciones de Lagrange aun sin ser máximos ni mínimos.

 

Como ya se ha señalado, el punto débil de la pseudodemostración anterior radica en el supuesto de diferenciabilidad de la función valor , ya que esta función no es necesariamente diferenciable aunque lo sean las funciones  que intervienen en su definición. Esta situación es típica en Optimización, donde frecuentemente se obtienen funciones no diferenciables construidas a partir de otras que sí que lo son. Ello ha llevado en las últimas décadas al desarrollo del llamado Análisis No Diferenciable (“Nonsmooth Analysis”), que tiene su punto de partida en el trabajo de Frank H. Clarke [1] en que se introduce la noción de gradiente generalizado para funciones localmente lipschitzianas. Esta noción está inspirada en el Análisis Convexo [9] y diseñada para ser aplicada en problemas de optimización, como lo prueba el hecho de que el propio autor la utilizó poco después [2] para obtener generalizaciones del teorema de los multiplicadores de Lagrange para problemas con funciones localmente lipschitzianas no necesariamente convexas ni diferenciables. El lector interesado en el Análisis No Diferenciable y sus aplicaciones a Optimización y a Teoría de Control puede consultar el clásico libro [3] o el más reciente [4].

 

 

Interpretación económica

 

Volviendo a la interpretación de los multiplicadores de Lagrange obtenida en (5), vamos a examinarla en el caso de varios problemas clásicos de la Teoría Económica.

 

El primer problema que consideraremos es el de planificación de actividades a partir de unos recursos disponibles y una cierta tecnología. Supongamos que se trata de determinar las cantidades  de ciertos outputs, que se producen a partir de  inputs de los que se disponen cantidades , de forma que se maximice el beneficio  (medido en unidades monetarias). La tecnología que permite la transformación de inputs en outputs viene dada por las funciones : la función  indica la cantidad  del input  que se requiere para producir las cantidades  de outputs. Así pues, las restricciones expresan la condición de que las cantidades consumidas de los inputs han de coincidir con las cantidades disponibles. Según (5), el multiplicador  coincide con la derivada del beneficio máximo respecto de la cantidad disponible del recurso . En otras palabras, , que se mide en unidades monetarias por unidad de recurso  nos permite valorar este recurso en la situación considerada, ya que si la cantidad del recurso  experimentara un pequeño incremento  (positivo o negativo), el correspondiente beneficio máximo se incrementaría aproximadamente en . Este precio atribuible al recurso , que no tiene por qué guardar ninguna relación con el precio de mercado, es lo que se conoce en Economía con el nombre de precio sombra.

 

Otro ejemplo clásico en Microeconomía (véase, por ejemplo, [7]) es el problema de maximización de la utilidad del consumidor. Se trata del problema que se plantea un consumidor de cómo gastar su renta disponible  en la adquisición de bienes. En el mercado hay  bienes, a precios , y el consumidor desea determinar la mejor cesta  (  denota la cantidad del bien  que forma parte de la cesta) posible según sus preferencias, teniendo en cuenta la restricción presupuestaria  Suponiendo que las preferencias del consumidor están representadas por una función de utilidad , es decir, una función tal que la desigualdad  indica que el consumidor aprecia la cesta  al menos tanto como la cesta , el problema a resolver es el de maximizar  bajo la citada restricción. En el caso de este problema, la función valor óptimo  asigna a cada valor posible  de la renta la utilidad máxima  alcanzable y, según la interpretación que hemos visto en el caso general, el multiplicador de Lagrange  asociado a la restricción presupuestaria coincide con , lo que en el lenguaje económico se expresa diciendo que  es la utilidad marginal de la renta. Análogamente a lo que se ha visto en el caso del problema de planificación de actividades, esto significa que un pequeño incremento  en la renta disponible remunera al consumidor con una utilidad adicional aproximadamente igual a .

 

Consideremos ahora otro problema económico típico, el de minimización de costes. En este caso se trata de determinar las cantidades de inputs  necesarias para obtener una cantidad prefijada  de un output al mínimo coste; la tecnología viene dada por una función de producción  que asigna a cada vector de inputs  la cantidad  de output que se puede producir con ellos, y se suponen dados los costes unitarios  de los inputs. El problema a resolver es, pues, el de minimizar  bajo la restricción  La función valor  asigna ahora a cada cantidad posible  de output el mínimo coste  al que puede producirse, y el multiplicador de Lagrange  de la restricción satisface , así que es el coste marginal del output, en el sentido de que un pequeño incremento  en la cantidad requerida de output comporta un coste adicional aproximadamente igual a .

 

 

Programación convexa

 

Como ya hemos dicho, el Análisis No Diferenciable, que surgió en la década de los setenta para cubrir las necesidades de la Teoría de Optimización y de la Teoría de Control, tuvo como fuente de inspiración el Análisis Convexo (no obstante, existen nociones de derivadas generalizadas muy anteriores al Análisis Convexo, algunas tan antiguas como las derivadas de Dini, que datan de finales del siglo XIX). El Análisis Convexo [9], como su nombre sugiere, trata del análisis de funciones convexas (no necesariamente diferenciables), y se fundamenta en las propiedades geométricas de los conjuntos convexos. Una función  definida sobre un subconjunto convexo  de  (o, más generalmente, de un espacio vectorial real) se dice que es convexa si su epigrafo,

 

 

 

es un conjunto convexo o, equivalentemente, si satisface

 

 

 

Es interesante observar que esta definición, aun siendo puramente algebraica (sólo utiliza la estructura lineal de  ), tiene importantes consecuencias topológicas cuando en  se considera la métrica euclídea: toda función convexa es continua (incluso localmente lipschitziana) en el interior de su dominio. Por otra parte, la derivada direccional (unilateral)

 

 

 

existe (y es finita) si la dirección  es tal que  para  suficientemente pequeño; para probar esto basta observar que el cociente

 

 

 

es una función creciente de . Otra propiedad fundamental, de demostración también inmediata, es que  es una función convexa (y positivamente homogénea) de . El punto de partida del Análisis Convexo se encuentra en la siguiente caracterización de la convexidad para funciones diferenciables: una función diferenciable  definida sobre un convexo abierto  es convexa si, y sólo si,

 

 

(6)

 

en esta desigualdad,  denota producto escalar. En el caso no necesariamente diferenciable, como consecuencia del teorema del hiperplano soporte puede probarse que, suponiendo de nuevo que el dominio  de  es convexo y abierto,  es convexa si, y sólo si, para cada  existe un vector  tal que

 

 

(7)

 

como se ve comparando (7) con (6), un tal vector juega en el caso no diferenciable el papel que desempeña el gradiente en el caso diferenciable, y por esta razón se dice que  es un subgradiente de  en . El conjunto de todos los subgradientes de  en , que es convexo y cerrado, recibe el nombre de subdiferencial de la función en el punto, y se denota  Por ejemplo, en el caso de la función valor absoluto es fácil ver que el subdiferencial en el origen es el intervalo cerrado  Puede demostrarse que  es diferenciable en  si, y sólo si,  se reduce a un solo elemento, en cuyo caso se tiene  Esta igualdad es consecuencia de un resultado más general, que expresa el subdiferencial a partir de las derivadas direccionales:

 

 

(8)

 

De esta igualdad se desprende que el subdiferencial, cuya definición es de naturaleza global (calcular el subdiferencial de  en  requiere, en principio, conocer los valores de la función en todo su dominio) es, de hecho, una noción local (en el caso de funciones convexas), ya que las derivadas direccionales  pueden calcularse conociendo únicamente los valores de  en un entorno de  

 

En realidad, el subdiferencial  y las derivadas direccionales  proporcionan la misma información acerca de la función , puesto que la igualdad (8) admite la siguiente relación inversa:

 

 

 

(esta igualdad expresa que la derivada direccional de  en  como función de la dirección, es la función soporte del subdiferencial de  en ese punto). La importancia de la noción de subdiferencial radica, además de en estas propiedades, en que existe un cálculo subdiferencial prácticamente tan rico como el cálculo diferencial clásico.

 

Consideremos ahora el problema de maximizar una función  bajo restricciones de desigualdad  en lugar de las restricciones de igualdad que se han considerado en las secciones anteriores.

 

Frecuentemente en las aplicaciones económicas tiene más sentido considerar restricciones de desigualdad; piénsese, por ejemplo, en el problema de planificación de actividades, en el que no hay por qué exigir que se agote la totalidad de los recursos disponibles. El problema de maximización se dice que es convexo si la función objetivo  es cóncava (es decir, si  es convexa) y las funciones restricción  son convexas. Suponiendo que  es un punto interior de la intersección de los dominios de las funciones  y que las restricciones cumplen cierta condición de regularidad (por ejemplo, la condición de Slater de que exista un punto en que todas las restricciones se cumplan con desigualdad estricta), el teorema de Kuhn-Tucker establece la existencia de multiplicadores  tales que

 

 

(9)

 

(en esta expresión la multiplicación de escalares por subconjuntos de  es la usual, y la suma de conjuntos es asimismo la de Minkowski); además todos los multiplicadores  son no-negativos y satisfacen las condiciones de complementariedad

 

 

(10)

 

Obsérvese que, en el caso diferenciable, la condición (9) se reduce a (3). En el que nos ocupa de problemas convexos, estas condiciones de Kuhn-Tucker son también suficientes para máximo global, es decir, si existen multiplicadores no negativos  que satisfacen (9) y (10) entonces  es un máximo global. Así pues, para problemas convexos con restricciones que satisfacen una condición de regularidad como, por ejemplo, la de Slater, las condiciones de Kuhn-Tucker son necesarias y suficientes para máximo global. Además, la interpretación que hemos visto anteriormente de los multiplicadores de Lagrange se extiende a problemas convexos de la siguiente manera: si consideramos la función valor correspondiente,

 

 

 

puede verse fácilmente que esta función es cóncava y que  es un vector de multiplicadores asociado a una solución óptima de nuestro problema de maximización si, y sólo si, , lo que en el caso en que  es diferenciable se reduce a , igual que en el caso ya analizado de problemas con restricciones de igualdad. Tomando como modelo el problema de planificación de actividades, la interpretación de las condiciones de no negatividad y de complementariedad resulta transparente: los precios sombra de los recursos no pueden ser negativos (un incremento en la disponibilidad de un recurso no puede ser perjudicial, ya que no estamos obligados a agotar el recurso), y sólo puede ser estrictamente positivo el precio sombra de un recurso que se agota en el plan óptimo (un recurso superabundante carece de valor económico, ya que un ligero incremento en su disponibilidad no nos reporta ningún beneficio extra). De esta caracterización de los multiplicadores se deduce que un tal vector  no está asociado a una solución óptima, pues el conjunto  es independiente de estas soluciones. En otras palabras, si  es una solución óptima,  es un vector de multiplicadores asociado a esta solución, y  es otra solución óptima, entonces  también está asociado a .

 

Por razones de brevedad omitimos otras versiones del teorema de Kuhn-Tucker para problemas no convexos en los que hay a la vez restricciones de igualdad y de desigualdad.

 

El teorema de Kuhn-Tucker para problemas convexos tiene una interesante interpretación, que expondremos a continuación, en términos de la función lagrangiana (2). Para simplificar la notación, escribiremos  y llamaremos  a la intersección de los dominios de las funciones . Puede verse que un par  está formado por una solución óptima  y un vector de multiplicadores asociado  si, y sólo si, es un punto de silla de la función lagrangiana, es decir,

 

 

 

Esto permite reinterpretar el problema de optimización como un juego de dos personas y suma cero: los jugadores son el agente optimizador, que tiene por estrategias los vectores  (satisfagan o no las restricciones), y “la naturaleza” (o el mercado), cuyas estrategias son los vectores de multiplicadores   La función de pagos es la función lagrangiana, de manera que si el par de estrategias adoptadas es  la naturaleza paga al agente optimizador la cantidad  La interpretación económica, tomando como referencia el problema de planificación de actividades, es que la naturaleza asigna precios  a los recursos y retribuye al agente optimizador mediante el valor  de la función objetivo en la estrategia adoptada más los valores, de acuerdo con esos precios, de los recursos no consumidos (estas retribuciones adicionales son en realidad penalizaciones en el caso de recursos consumidos en cantidades superiores a sus disponibilidades). Los pares de estrategias de equilibrio  son precisamente los puntos de silla (en particular, las estrategias de equilibrio  satisfacen las restricciones del problema de maximización, aunque el agente optimizador puede escoger sus estrategias libremente, sin tener en cuenta estas restricciones), y es fácil ver que el valor del juego  coincide con el valor óptimo  del problema de maximización.

 

 

Conclusiones

 

En este artículo hemos intentado poner de manifiesto que los multiplicadores de Lagrange son mucho más que meras variables auxiliares y poseen interesantes interpretaciones, en especial en el caso de problemas de naturaleza económica. Además, a pesar de haber cumplido ya más de doscientos años, siguen gozando de buena salud; en efecto, aún hoy continúan siendo objeto de investigación en relación con otros problemas de optimización más sofisticados que los considerados en este artículo. El lector interesado puede constatar la veracidad de esta afirmación consultando el reciente libro [8] y las referencias allí citadas. Otra lectura altamente recomendable, que constituye una excelente invitación a profundizar en la teoría de los multiplicadores de Lagrange y temas relacionados, es el artículo [10].

 

 

Referencias

 

[1]      F.H. Clarke: Generalized gradients and applications. Trans. Amer. Math. Soc. 205 (1975), 247–262.

[2]      F.H. Clarke: A new approach to Lagrange multipliers. Math. Oper. Res. 1, no. 2 (1976), 165–174.

[3]      F.H. Clarke: Optimization and nonsmooth analysis (2nd. ed.). Classics in Applied Mathematics 5. Society for Industrial and Applied Mathematics (SIAM), Philadelphia, PA, 1990.

[4]      F.H. Clarke, Y.S. Ledyaev, R.J. Stern, P.R. Wolenski: Nonsmooth analysis and control theory. Graduate Texts in Mathematics 178. Springer-Verlag, New York, 1998.

[5]      J.L. Lagrange: Méchanique Analitique. Veuve Desaint, 1788.

[6]      J.L. Lagrange: Théorie des fonctions analytiques contenant les principes du calcul différentiel. Imprimerie de la République, 1797.

[7]      A. Mas-Colell, M.D. Whinston, J.R. Green: Microeconomic Theory. Oxford University Press, Oxford, 1995.

[8]      B.S. Mordukhovich: Variational analysis and generalized differentiation: II. Applications. Grundlehren der Mathematischen Wissenschaften 331. Springer-Verlag, Berlin, 2006.

[9]      R.T. Rockafellar: Convex analysis. Princeton Mathematical Series 28. Princeton University Press, Princeton, NJ, 1970.

[10]    R.T. Rockafellar: Lagrange multipliers and optimality. SIAM Rev. 35, no. 2 (1993), 183–238.

 

 

Sobre el autor

Juan Enrique Martínez Legaz es doctor en Matemáticas por la Universidad de Barcelona (1981) y catedrático de Fundamentos del Análisis Económico de la Universidad Autónoma de Barcelona. Algunas de las principales revistas científicas en que ha publicado artículos son: Mathematical Programming, SIAM Journal on Optimization, European Journal of Operational Research, Set-Valued Analysis, Journal of Global Optimization y Expositiones Mathematicae. Es director de la revista Optimization y miembro de los comités editoriales de las revistas Journal of Convex Analysis, Journal of Global Optimization, TOP y Cuadernos Aragoneses de Economía.