Economía
Escrito por Redacción Matematicalia   
domingo, 27 de enero de 2008
El uso de sistemas dinámicos estocásticos en la Teoría de Juegos y la Economía

Recibido: lunes, 18 junio 2007




El uso de sistemas dinámicos estocásticos en la Teoría de Juegos y la Economía

 

Roberto Serrano

Department of Economics, Brown University e IMDEA-Ciencias Sociales

e-mail: Esta dirección de correo electrónico está protegida contra los robots de spam, necesita tener Javascript activado para poder verla

página web: http://www.econ.brown.edu/faculty/serrano

 

 

 

1. Introducción

 

El enfoque evolutivo a la Biología se puede emprender con herramientas de la Teoría de Juegos, porque lo que se está estudiando es el “juego de la vida” o el “juego de la supervivencia” entre las distintas especies. Cada especie exhibe unos patrones de comportamiento, hay interacción entre ellas, y uno puede preguntarse qué tipo de comportamientos son los que sobrevivirán a largo plazo. Por ejemplo, uno puede intentar capturar la lógica de Darwin de este modo. Fijemos un modo de comportamiento o estrategia que todos los individuos de una población están siguiendo por el momento. Supongamos que hay una mutación en los genes de esta población. Esto es, de repente una pequeña proporción ε>0 de individuos empiezan a comportarse de otro modo. A partir de ahora hay tres tipos de interacciones que uno puede encontrar en el juego básico: “no mutante con no mutante”, “no mutante con mutante” y “mutante con mutante”. Si uno interpreta los pagos del juego a cada individuo como el número de descendientes, una pregunta interesante es si esta mutación tenderá a desaparecer porque la descendencia relativa del mutante, con respecto al no mutante, es menor. De lo contrario, estamos ante una mutación con éxito, que eventualmente se extiende a todo el sistema.

 

Esta lógica lleva al concepto de estrategias evolutivamente estables, esto es, aquellas que son inmunes a este tipo de invasiones por parte de mutantes arbitrarios. Una observación de interés es que este concepto está basado en una manera de perturbar el sistema dinámico que es bastante irrealista. La perturbación, consistente en la aparición aleatoria del mutante, se concibe como un hecho aislado en el tiempo, y de hecho sus efectos se estudian bajo el supuesto de que, mientras están pasando, el sistema no está sujeto a ninguna otra perturbación. Pero en general uno debería esperar que, mientras los efectos de la primera perturbación se están aún notando, el sistema reciba un nuevo shock. Y más aún: mientras los efectos de estas dos perturbaciones están teniendo lugar, una tercera ocurra, etc., etc. Este argumento motiva el uso de sistemas dinámicos estocásticos, en los cuales la matriz de transición ya incorpora las probabilidades de toda posible perturbación. (Una referencia básica importante es el libro de Freidlin y Wentzell [5]).

 

En las últimas dos décadas la metodología de sistemas dinámicos estocásticos se ha venido utilizando con creciente frecuencia en la Teoría de Juegos y en la Economía. Entre las primeras aplicaciones de la metodología se encuentra su uso en la Biología Evolutiva, como en el trabajo de Foster y Young [4], pero muy pronto surgieron aplicaciones a la Teoría de Juegos en general en los trabajos de Kandori, Mailath y Rob [7] y Young [12]. Desde el punto de vista conceptual, hay un gran interés en la adopción de esta metodología en juegos. El concepto del equilibrio de Nash, la solución central de la Teoría de Juegos, es algunas veces atacado debido a la gran racionalidad que requiere de parte de los jugadores. Sería deseable en aras del realismo el que tal concepto no dependiera de tan grandes niveles de sofisticación intelectual de los agentes. Esta metodología evolutiva, basada en los sistemas dinámicos estocásticos, tiene mucho que decir al respecto.

 

El modelo que se estudia habitualmente fija un juego, esto es, conjuntos de estrategias y funciones de pagos. En el juego participan agentes que, lejos de ser racionales, están “programados” para usar una determinada estrategia. Estos agentes no son conscientes del complejo mundo en el que viven, ni dedican gran parte de su tiempo a pensar en qué estrategia deben emplear. De hecho, la mayoría del tiempo, siguiendo un fuerte componente de inercia, emplean la misma estrategia que usaron el periodo anterior (aquella que, por ejemplo, aprendieron en su entorno social de familia y amigos). De vez en cuando, sin embargo, este proceso de inercia se ve interrumpido por una fuerza de selección, en el sentido biológico del término. Es decir, algún agente decide poner un poco más de esfuerzo en pensar en su estrategia, determinando por ejemplo que debería elegir una mejor respuesta al perfil de estrategias que los otros eligieron el periodo anterior. Finalmente, hay además fuerzas aleatorias en el sistema –mutaciones, errores, experimentación– que llevan a que, con probabilidad positiva aunque pequeña, se elija cualquier estrategia. La pregunta relevante es si se puede determinar cuáles serán las estrategias que se eligen en el juego la mayoría del tiempo a largo plazo. Tales estrategias se denominan estocásticamente estables. Y la respuesta, más que interesante, es que, bajo ciertas condiciones, se puede demostrar que tales estrategias están relacionadas con cierto tipo de equilibrios de Nash. Una gran fuente de consulta que describe muchas de las aplicaciones a juegos es el libro de Young [13].

 

En este artículo, para fijar ideas, nos concentraremos en la aplicación de las mismas herramientas a economías de intercambio. Una economía de intercambio es un sistema donde los agentes intercambian los bienes que cada uno posee para llegar a una mejor asignación de los recursos disponibles. En tal contexto, uno puede preguntar si la asignación final es eficiente, o si tiene alguna relación con aquella que saldría de un equilibrio en una red de mercados competitivos. Modelos así se han estudiado en los artículos de Ben-Shoham, Serrano y Volij [1], Kandori, Serrano y Volij [8], o Serrano y Volij [10]. De hecho, el modelo que describiremos más en detalle lo tomaremos prestado de este último artículo. Pasamos a ello.

 

Fijemos una economía de intercambio, esto es, preferencias de los agentes y dotaciones individuales de bienes. El proceso dinámico de intercambio que analizaremos, una formalización de las ideas de Edgeworth [2], es el siguiente. Cada periodo, obedeciendo a fuerzas de inercia, los agentes intercambian sus dotaciones iniciales como lo hicieron en el periodo pasado para llegar a una nueva asignación de recursos y, tras ese intercambio, cierto consumo de los bienes tiene lugar. Sin embargo, de vez en cuando, se puede formar una coalición de agentes. Esta coalición evalúa si, mediante la redistribución entre sus miembros de los recursos coalicionales, todos pueden mejorar. Si así fuera, la coalición firma este nuevo contrato, que por tanto puede romper los contratos previos subyacentes al anterior status quo. Esta posibilidad de contratos coalicionales es análoga a la fuerza de selección descrita anteriormente. Por último, las fuerzas aleatorias en el sistema pueden venir dadas porque los agentes pueden equivocarse con una pequeña probabilidad, y firmar un contrato coalicional que no les favorece. Como antes, la pregunta en este contexto es si se pueden caracterizar las asignaciones de recursos en la economía a las que este proceso de intercambio llevará la mayoría del tiempo a largo plazo, es decir, las asignaciones estocásticamente estables del proceso. Como describiremos, bajo ciertas condiciones la respuesta será la asignación asociada con el equilibrio competitivo de mercados.

 

 

2. Metodología: Primeros auxilios en procesos de Markov

 

A menudo un proceso de Markov sin perturbaciones tiene múltiples distribuciones estacionarias o invariantes, correspondientes a las múltiples clases recurrentes. Una clase recurrente del proceso es un conjunto de estados tal que, si el proceso visita uno de ellos, no será capaz de salir de dicho conjunto. Cuando una clase recurrente contiene un solo estado, el estado en cuestión se denomina absorbente. Cuando existen múltiples clases recurrentes, se hace difícil dar una predicción de largo plazo sobre la posición del sistema: tal predicción dependerá en general de las condiciones iniciales.


El problema descrito justifica el uso de procesos de Markov perturbados. Para un ε (0,1) arbitrariamente pequeño, el proceso  perturbado es irreducible y las probabilidades de transición entre estados convergen a las del proceso sin perturbaciones a una tasa exponencial. Tal proceso es ergódico, lo cual implica que tiene una única distribución estacionaria. La denotamos . En efecto, las perturbaciones hacen inviable el concepto de clase recurrente, ya que tales perturbaciones pueden llevar el sistema de cualquier estado a cualquier otro en un número finito de periodos. Una vez que el sistema ha echado a andar durante un largo intervalo de tiempo, la distribución estacionaria proporciona un buen estimador de la frecuencia relativa con la que el sistema visita cada uno de los estados.

 

Se puede demostrar que la distribución límite existe, y es una de las distribuciones estacionarias del proceso sin perturbaciones. Denominamos estados estocásticamente estables de a los que asigna probabilidad positiva. Estos estados están caracterizados como aquellos con mínimo potencial estocástico (los de más fácil acceso desde cualquier otro estado). La tarea de este enfoque es la identificación de tales estados, los cuales constituyen nuestra predicción de largo plazo cuando las perturbaciones del sistema original obedecen el proceso .

 

 

3. Aplicación: una economía de intercambio

 

Consideremos una de las economías de intercambio más simples, el llamado modelo de casas de Shapley y Scarf [11]. Una economía de intercambio de casas,

 

= N, H, ( i , ei)iN ,

 

donde

 

  • N = {1, ..., n} es un conjunto finito de individuos,
  • H = {h1,... , hn} es un conjunto finito de casas,
  • i es la relación binaria de preferencias sobre H del agente i, la cual suponemos completa, transitiva y antisimétrica, y
  • ei es la casa dotación inicial de i.

 

Esto es, hay el mismo número de individuos y casas. Cada agente está dotado inicialmente con una casa, y tiene preferencias estrictas sobre las |N| casas.

 

Las siguientes son definiciones de importancia en la economía:

 

  • Coalición S: subconjunto no vacío de N.
  • Asignación factible para la coalición S: redistribución de (ei)iS. Denotamos este conjunto AS. También, AN = A es el conjunto de |N|! asignaciones factibles en la economía.
  • Asignación individualmente racional x A: no existe i N tal que ei i xi.
  • Asignación del núcleo x A: no existe S N con y AS tal que yi i xi para todo i S.
  • Asignación del núcleo fuerte x A: no existe S N con y AS tal que yi i xi para todo i S e yj j xj para algún j S.
  • Asignación competitiva x A: p\{0} tal que i N, h i xi implica ph > pei .

 

La última definición es el concepto central en la Teoría Económica de Mercados. Es decir, existen precios, uno por casa, que igualan la oferta y la demanda por cada casa. La economía se encuentra en equilibrio: las fuerzas competitivas del mercado hacen ajustar los precios de tal manera que todo exceso de demanda u oferta queda eliminado. La condición en la definición dice que aquellas casas que un individuo prefiera a la que recibe en la asignación de equilibrio caen fuera de su conjunto presupuestario (para comprar una casa sólo puede vender la que es su dotación inicial). Por tanto, la casa que cada agente recibe en equilibrio es una de las que más le gustan entre las que se puede permitir comprar.

 

En estas economías, el siguiente resultado es de interés:

 

Lema (Roth y Postlewaite [9]). Sea  una economía de intercambio de casas como la definida. Entonces:

(i)       Existe una única asignación competitiva  ω de la economía .

(ii)     La asignación ω es la única en el núcleo fuerte.

(iii)    Para cada asignación x A, xω, existe una coalición S tal que  ωS AS y satisface que  ωi i xi para todo i S y  ωj j xj para algún j S.

 

Introduzcamos a continuación el proceso de intercambio coalicional que estudiaremos. Como hemos dicho, es una formalización de ideas de Edgeworth, que ya recibieron una modelización formal en los trabajos de Feldman [3] y Green [6]. Nuestro tratamiento será esencialmente una versión estocástica de los procesos de estos autores.

 

Consideremos pues el proceso de intercambio sin perturbaciones. En cada periodo t, si el sistema está en la asignación –estado– x(t), cualquier coalición S es elegida con probabilidad positiva.

 

(i)        Si y AS tal que  yi i xi(t) i S, la coalición llega a cualquiera de tales y con probabilidad positiva. Entonces, el nuevo estado es

 

x(t + 1) = (y,eS) si xS(t)  AS,  ó

x(t + 1) = (y, xS(t)) si xS(t) AS.

 

(ii)      En otro caso, x(t + 1) = x(t).

 

Ejemplo. Sea N = {1,2,3}. Las preferencias de los agentes son:

 

e3 1 e2 1 e1

e1 2 e3 2 e2

e2 3 e1 3 e3.

 

Consideremos las tres asignaciones siguientes, y observemos que constituyen una clase recurrente del proceso especificado: x = (e1, e3 ,e2), y = (e2, e1, e3), z = (e3, e2, e1). Esto es, x {1,2} y {1,3} z{2,3} x.  Tenemos un ciclo del cual es imposible salir, llamado ciclo de Condorcet en la Teoría de Elección Social.

 

Nuestra primera tarea es la identificación de las clases recurrentes del proceso de intercambio sin perturbaciones:

 

Proposición. Las clases recurrentes del proceso sin perturbaciones son de los dos tipos siguientes:

(i)        Clases recurrentes unitarias, o estados absorbentes: cada una de las asignaciones del núcleo.

(ii)  Clases recurrentes con múltiples elementos: en cada una de ellas, las asignaciones son individualmente racionales, pero no del núcleo (ver el ejemplo anterior).

 

Por tanto, queda claro que la predicción de largo plazo no se puede dar con independencia de las condiciones iniciales. Procedamos a introducir perturbaciones.

 

Consideremos ahora el proceso con perturbaciones. Sea ε (0,1) arbitrariamente pequeña la probabilidad de que un agente intercambie y acabe con la misma casa; sea ελ la probabilidad de aceptar un intercambio coalicional donde el agente acaba con una casa peor, donde λ  es un entero positivo suficientemente grande. Es decir, aunque los dos tipos de errores en la toma de decisiones del agente ocurren con baja probabilidad, los del segundo tipo –errores más graves– son mucho más improbables.

 

Supongamos que el estado es la asignación x, que la coalición S se forma, y que el sistema llega a y. Definamos:

 

n = |{i S : xi=yi}|,

n = |{i S : xi i  yi}|.

 

Esto es, estos dos números son, respectivamente, el número de agentes que acaban con la misma casa o con una peor en esta transición.

 

Ahora podemos definir la resistencia de pasar de x a y a través de S:

 

Si yS AS,

rS(x,y) = ∞;

Si yS AS,

rS(x,y) = λnW + nI .

 

Una vez que calculamos así la resistencia de toda transición, llegamos a obtener la resistencia de la transición x→ y como la resistencia del camino más barato, esto es, la mínima resistencia total de toda transición x→ y:

 

xS0 z1 S1 ... zk Sk y.

 

Con el cuidadoso cálculo de tales resistencias, en este modelo se puede demostrar el siguiente resultado:

 

Teorema. Sea  una economía de intercambio de casas, y sea λ>|N|−2. Entonces, la única asignación estocásticamente estable de  es la asignación competitiva ω.

 

Podemos concluir con una breve idea de la demostración. Para cada xω, la transición x→ω solamente encuentra resistencias asociadas a indiferencias (recordemos la parte (iii) del lema). Por tanto, esto produce una resistencia que a lo sumo es |N|−2. Sin embargo, en la transición opuesta, ωx, al menos un individuo debe empeorar estrictamente (parte (ii) del lema), lo cual implica que la resistencia de tal transición es al menos λ. Poniendo los dos argumentos juntos, se puede probar que la asignación competitiva es la única estocásticamente estable, pero hemos llegado a ella sin ninguna apelación a precios de mercado.

 

 

Reconocimientos

 

El autor agradece la hospitalidad del CEMFI en Madrid.

 

 

Bibliografía

 

[1] A. Ben-Shoham, R. Serrano, O. Volij: The evolution of exchange. Journal of Economic Theory 114 (2004), 310-328.

[2] F.Y. Edgeworth: Mathematical Psychics. Kegan Paul Publishers, London, 1881.

[3] A.M. Feldman: Recontracting stability, Econometrica 42, (1974), 35-44.

[4] D.P. Foster, H.P. Young: Stochastic evolutionary game dynamics. Theoretical Population Biology 38 (1990), 219-232.

[5] M. Freidlin, A. Wentzell: Random Perturbations of Dynamical Systems. Springer-Verlag, Berlin, 1984.

[6] J.R. Green: The stability of Edgeworth's recontracting process. Econometrica 42 (1974), 21-34.

[7] M. Kandori, G. Mailath, R. Rob: Learning, mutations and long run equilibria in games. Econometrica 61 (1993), 29-56.

[8] M. Kandori, R. Serrano, O.Volij: Decentralized trade, random utility and the evolution of social welfare. Aparecerá en Journal of Economic Theory.

[9] A.E. Roth, A. Postlewaite: Weak versus strong domination in a market for indivisible goods. Journal of Mathematical Economics 4 (1977), 131-137.

[10] R. Serrano, O. Volij: Mistakes in cooperation: the stochastic stability of Edgeworth's recontracting. Working Paper 2003-23, Department of Economics, Brown University.

[11] L.S. Shapley, H. Scarf: On cores and indivisibility. Journal of Mathematical Economics 1 (1974), 23-28.

[12] H. P. Young: The evolution of conventions. Econometrica 61 (1993), 57-84.

[13] H.P. Young: Individual Strategy and Social Structure: an Evolutionary Theory of Institutions. Princeton University Press, Princeton, NJ, 1998.

 

 

Sobre el autor

Roberto Serrano es Harrison S. Kravis University Professor of Economics en Brown University (Providence, Rhode Island, USA), y profesor de investigación en IMDEA-Ciencias Sociales (Madrid, España). Se doctoró en Economía por la Universidad de Harvard en 1992. Ha sido profesor visitante en el Center for Rationality de la Hebrew University of Jerusalem, Universitat Pompeu Fabra, Institute for Advanced Study de Princeton, Universidad Carlos III de Madrid, y CEMFI. Sus áreas de interés son la microeconomía y la teoría de juegos. Ha hecho importantes contribuciones a la teoría de la implementación y diseño de mecanismos, teoría de subastas y negociaciones, economía de la incertidumbre y de la información, y teoría del equilibrio económico general. Ha recibido numerosos premios y galardones por su investigación, incluyendo el Premio de la Fundación Banco Herrero al mejor economista español menor de 40 años (2004), la Alfred P. Sloan Foundation Research Fellowship (1998), la Harvard Graduate School of Arts and Sciences Merit Fellowship (1991), y premios de la ONCE en 1993 and 1988. Su investigación ha sido subvencionada por varias instituciones, incluyendo la US National Science Foundation, US-Israel Binational Science Foundation, Fulbright Foundation, Fundación Ramón Areces, Ministerio de Educación y Ciencia y Dirección General de Investigaciones Científicas y Técnicas. Recibió el William McLaughlin Award a la excelencia docente en Ciencias Sociales en la Brown University  en 1999, y el Omicron-Delta-Epsilon Economics Professor of the Year Award en 2006.