Recibido: lunes, 18 junio 2007
El uso de sistemas dinámicos estocásticos en la Teoría
de Juegos y la Economía
Roberto
Serrano
Department
of Economics, Brown University e IMDEA-Ciencias Sociales
e-mail:
Esta dirección de correo electrónico está protegida contra los robots de spam, necesita tener Javascript activado para poder verla
página
web: http://www.econ.brown.edu/faculty/serrano
1. Introducción
El enfoque
evolutivo a la Biología se puede emprender con herramientas de la Teoría de
Juegos, porque lo que se está estudiando es el “juego de la vida” o el “juego
de la supervivencia” entre las distintas especies. Cada especie exhibe unos
patrones de comportamiento, hay interacción entre ellas, y uno puede
preguntarse qué tipo de comportamientos son los que sobrevivirán a largo plazo.
Por ejemplo, uno puede intentar capturar la lógica de Darwin de este modo. Fijemos
un modo de comportamiento o estrategia que todos los individuos de una
población están siguiendo por el momento. Supongamos que hay una mutación en
los genes de esta población. Esto es, de repente una pequeña proporción ε>0 de individuos empiezan a comportarse de otro modo. A partir de ahora
hay tres tipos de interacciones que uno puede encontrar en el juego básico: “no
mutante con no mutante”, “no mutante con mutante” y “mutante con mutante”. Si
uno interpreta los pagos del juego a cada individuo como el número de
descendientes, una pregunta interesante es si esta mutación tenderá a
desaparecer porque la descendencia relativa del mutante, con respecto al no
mutante, es menor. De lo contrario, estamos ante una mutación con éxito, que
eventualmente se extiende a todo el sistema.
Esta lógica
lleva al concepto de estrategias evolutivamente estables, esto es,
aquellas que son inmunes a este tipo de invasiones por parte de mutantes
arbitrarios. Una observación de interés es que este concepto está basado en una
manera de perturbar el sistema dinámico que es bastante irrealista. La
perturbación, consistente en la aparición aleatoria del mutante, se concibe
como un hecho aislado en el tiempo, y de hecho sus efectos se estudian bajo el
supuesto de que, mientras están pasando, el sistema no está sujeto a ninguna
otra perturbación. Pero en general uno debería esperar que, mientras los
efectos de la primera perturbación se están aún notando, el sistema reciba un
nuevo shock. Y más aún: mientras los
efectos de estas dos perturbaciones están teniendo lugar, una tercera ocurra,
etc., etc. Este argumento motiva el uso de sistemas dinámicos estocásticos, en
los cuales la matriz de transición ya incorpora las probabilidades de toda
posible perturbación. (Una referencia básica importante es el libro de Freidlin
y Wentzell [5]).
En las últimas
dos décadas la metodología de sistemas dinámicos estocásticos se ha venido
utilizando con creciente frecuencia en la Teoría de Juegos y en la Economía.
Entre las primeras aplicaciones de la metodología se encuentra su uso en la
Biología Evolutiva, como en el trabajo de Foster y Young [4], pero muy pronto surgieron aplicaciones a la Teoría de
Juegos en general en los trabajos de Kandori, Mailath y Rob [7] y Young [12].
Desde el punto de vista conceptual, hay un gran interés en la adopción de esta
metodología en juegos. El concepto del equilibrio de Nash, la solución central
de la Teoría de Juegos, es algunas veces atacado debido a la gran racionalidad
que requiere de parte de los jugadores. Sería deseable en aras del realismo el
que tal concepto no dependiera de tan grandes niveles de sofisticación
intelectual de los agentes. Esta metodología evolutiva, basada en los sistemas
dinámicos estocásticos, tiene mucho que decir al respecto.
El modelo que
se estudia habitualmente fija un juego, esto es, conjuntos de estrategias y
funciones de pagos. En el juego participan agentes que, lejos de ser
racionales, están “programados” para usar una determinada estrategia. Estos
agentes no son conscientes del complejo mundo en el que viven, ni dedican gran
parte de su tiempo a pensar en qué estrategia deben emplear. De hecho, la
mayoría del tiempo, siguiendo un fuerte componente de inercia, emplean
la misma estrategia que usaron el periodo anterior (aquella que, por ejemplo,
aprendieron en su entorno social de familia y amigos). De vez en cuando, sin
embargo, este proceso de inercia se ve interrumpido por una fuerza de selección,
en el sentido biológico del término. Es decir, algún agente decide poner un
poco más de esfuerzo en pensar en su estrategia, determinando por ejemplo que
debería elegir una mejor respuesta al perfil de estrategias que los otros
eligieron el periodo anterior. Finalmente, hay además fuerzas aleatorias en
el sistema mutaciones,
errores, experimentación que llevan a que, con probabilidad positiva aunque pequeña, se elija cualquier
estrategia. La pregunta relevante es si se puede determinar cuáles serán las
estrategias que se eligen en el juego la mayoría del tiempo a largo plazo.
Tales estrategias se denominan estocásticamente estables. Y la respuesta,
más que interesante, es que, bajo ciertas condiciones, se puede demostrar que
tales estrategias están relacionadas con cierto tipo de equilibrios de Nash.
Una gran fuente de consulta que describe muchas de las aplicaciones a juegos es
el libro de Young [13].


En este
artículo, para fijar ideas, nos concentraremos en la aplicación de las mismas
herramientas a economías de intercambio. Una economía de intercambio es un sistema donde los agentes
intercambian los bienes que cada uno posee para llegar a una mejor asignación
de los recursos disponibles. En tal contexto, uno puede preguntar si la
asignación final es eficiente, o si tiene alguna relación con aquella que
saldría de un equilibrio en una red de mercados competitivos. Modelos así se
han estudiado en los artículos de Ben-Shoham, Serrano y Volij [1], Kandori, Serrano y Volij [8], o Serrano y Volij [10]. De hecho, el modelo que
describiremos más en detalle lo tomaremos prestado de este último artículo.
Pasamos a ello.
Fijemos una
economía de intercambio, esto es, preferencias de los agentes y dotaciones
individuales de bienes. El proceso dinámico de intercambio que analizaremos,
una formalización de las ideas de Edgeworth [2], es el siguiente. Cada periodo, obedeciendo a fuerzas de inercia,
los agentes intercambian sus dotaciones iniciales como lo hicieron en el
periodo pasado para llegar a una nueva asignación de recursos y, tras ese
intercambio, cierto consumo de los bienes tiene lugar. Sin embargo, de vez en
cuando, se puede formar una coalición de agentes. Esta coalición evalúa si,
mediante la redistribución entre sus miembros de los recursos coalicionales,
todos pueden mejorar. Si así fuera, la coalición firma este nuevo contrato, que
por tanto puede romper los contratos previos subyacentes al anterior status quo. Esta posibilidad de
contratos coalicionales es análoga a la fuerza
de selección descrita
anteriormente. Por último, las fuerzas aleatorias en el sistema pueden
venir dadas porque los agentes pueden equivocarse con una pequeña probabilidad,
y firmar un contrato coalicional que no les favorece. Como antes, la pregunta
en este contexto es si se pueden caracterizar las asignaciones de recursos en
la economía a las que este proceso de intercambio llevará la mayoría del tiempo
a largo plazo, es decir, las asignaciones estocásticamente estables del
proceso. Como describiremos, bajo ciertas condiciones la respuesta será la
asignación asociada con el equilibrio competitivo de mercados.
2. Metodología: Primeros auxilios en procesos de Markov
A menudo un
proceso de Markov
sin
perturbaciones tiene múltiples distribuciones estacionarias o invariantes,
correspondientes a las múltiples clases recurrentes. Una clase recurrente del proceso es un conjunto de estados tal que, si
el proceso visita uno de ellos, no será capaz de salir de dicho conjunto.
Cuando una clase recurrente contiene un solo estado, el estado en cuestión se
denomina absorbente. Cuando existen
múltiples clases recurrentes, se hace difícil dar una predicción de largo plazo
sobre la posición del sistema: tal predicción dependerá en general de las
condiciones iniciales.
El problema
descrito justifica el uso de procesos de Markov perturbados. Para un ε
(0,1) arbitrariamente pequeño, el proceso
perturbado es irreducible y las probabilidades
de transición entre estados convergen a las del proceso sin perturbaciones a
una tasa exponencial. Tal proceso es ergódico, lo cual implica que tiene una
única distribución estacionaria. La denotamos
. En efecto, las
perturbaciones hacen inviable el concepto de clase recurrente, ya que tales
perturbaciones pueden llevar el sistema de cualquier estado a cualquier otro en
un número finito de periodos. Una vez que el sistema ha echado a andar durante
un largo intervalo de tiempo, la distribución estacionaria proporciona un buen
estimador de la frecuencia relativa con la que el sistema visita cada uno de
los estados.


Se puede
demostrar que la distribución límite
existe,
y es una de las distribuciones estacionarias del proceso sin perturbaciones.
Denominamos estados estocásticamente estables de
a los que
asigna
probabilidad positiva. Estos estados están caracterizados como aquellos con
mínimo potencial estocástico (los de más fácil acceso desde cualquier otro
estado). La tarea de este enfoque es la identificación de tales estados, los
cuales constituyen nuestra predicción de largo plazo cuando las perturbaciones
del sistema original obedecen el proceso
.
3. Aplicación: una economía de intercambio
Consideremos
una de las economías de intercambio más simples, el llamado modelo de casas de Shapley y Scarf [11]. Una economía de intercambio
de casas,
donde
- N = {1, ..., n} es un conjunto finito de individuos,
- H = {h1,... , hn} es un conjunto finito de
casas,

i
es la relación binaria de preferencias sobre H del agente i, la cual
suponemos completa, transitiva y antisimétrica, y

ei es la casa
dotación inicial de i.
Esto es, hay
el mismo número de individuos y casas. Cada agente está dotado inicialmente con
una casa, y tiene preferencias estrictas sobre las |N| casas.
Las siguientes
son definiciones de importancia en la economía:
- Coalición S: subconjunto
no vacío de N.
- Asignación factible para la coalición S: redistribución
de (ei)i
S. Denotamos
este conjunto AS. También, AN = A es el conjunto de |N|! asignaciones
factibles en la economía.
- Asignación individualmente racional x
A: no existe i
N tal que ei
i xi.
- Asignación del núcleo x
A: no existe S
N con y
AS tal que yi
i xi para todo i
S.
- Asignación del núcleo fuerte x
A: no existe S
N con y
AS tal que yi
i xi para todo i
S e yj
j xj para algún j
S.
- Asignación competitiva x
A:
p
\{0} tal que
i
N, h
i xi implica ph > pei .
La última
definición es el concepto central en la Teoría Económica de Mercados. Es decir,
existen precios, uno por casa, que igualan la oferta y la demanda por cada
casa. La economía se encuentra en equilibrio: las fuerzas competitivas del
mercado hacen ajustar los precios de tal manera que todo exceso de demanda u
oferta queda eliminado. La condición en la definición dice que aquellas casas
que un individuo prefiera a la que recibe en la asignación de equilibrio caen
fuera de su conjunto presupuestario (para comprar una casa sólo puede vender la
que es su dotación inicial). Por tanto, la casa que cada agente recibe en
equilibrio es una de las que más le gustan entre las que se puede permitir
comprar.
En estas
economías, el siguiente resultado es de interés:
Lema (Roth y
Postlewaite [9]). Sea
una economía de intercambio de casas como la
definida. Entonces:
(i)
Existe una única asignación competitiva ω de la economía
.
(ii)
La asignación ω es la única en el núcleo
fuerte.
(iii)
Para cada asignación x
A, x≠ω, existe una
coalición S tal que ωS
AS y satisface que ωi
i xi para todo i
S y ωj
j xj para algún j
S.
Introduzcamos
a continuación el proceso de intercambio coalicional que estudiaremos. Como
hemos dicho, es una formalización de ideas de Edgeworth, que ya recibieron una
modelización formal en los trabajos de Feldman [3] y Green [6].
Nuestro tratamiento será esencialmente una versión estocástica de los procesos
de estos autores.
Consideremos
pues el proceso de intercambio
sin
perturbaciones. En cada periodo t, si el sistema
está en la asignación estado x(t), cualquier
coalición S es elegida con
probabilidad positiva.
(i)
Si
y
AS tal que yi
i xi(t)
i
S, la coalición llega a cualquiera de tales y con
probabilidad positiva. Entonces, el nuevo estado es
x(t + 1)
= (y,e−S) si x−S(t)
A−S, ó
x(t + 1)
= (y, x−S(t)) si x−S(t)
A−S.
(ii)
En otro caso, x(t + 1) = x(t).
Ejemplo. Sea N = {1,2,3}.
Las
preferencias de los agentes son:
e3
1
e2
1
e1
e1
2
e3
2
e2
e2
3
e1
3
e3.
Consideremos
las tres asignaciones siguientes, y observemos que constituyen una clase
recurrente del proceso especificado: x
= (e1, e3 ,e2), y
= (e2, e1, e3), z
= (e3, e2, e1). Esto es, x →{1,2} y
→{1,3} z→{2,3} x. Tenemos un ciclo del cual es
imposible salir, llamado ciclo de Condorcet
en la Teoría de Elección Social.
Nuestra
primera tarea es la identificación de las clases recurrentes del proceso de
intercambio sin perturbaciones:
Proposición. Las clases
recurrentes del proceso
sin
perturbaciones son de los dos tipos siguientes:
(i)
Clases recurrentes unitarias, o estados absorbentes:
cada una de las asignaciones del núcleo.
(ii)
Clases recurrentes con múltiples elementos: en cada
una de ellas, las asignaciones son individualmente racionales, pero no del
núcleo (ver el ejemplo anterior).
Por tanto,
queda claro que la predicción de largo plazo no se puede dar con independencia
de las condiciones iniciales. Procedamos a introducir perturbaciones.
Consideremos
ahora el proceso
con
perturbaciones. Sea ε
(0,1) arbitrariamente pequeña la probabilidad de que un agente intercambie
y acabe con la misma casa; sea ελ la probabilidad de aceptar
un intercambio coalicional donde el agente acaba con una casa peor, donde λ es un entero
positivo suficientemente grande. Es decir, aunque los dos tipos de errores en
la toma de decisiones del agente ocurren con baja probabilidad, los del segundo
tipo errores
más graves
son mucho más improbables.
Supongamos que
el estado es la asignación x, que la coalición S se forma, y
que el sistema llega a y. Definamos:
nI = |{i
S : xi=yi}|,
nW = |{i
S : xi
i yi}|.
Esto es, estos
dos números son, respectivamente, el número de agentes que acaban con la misma
casa o con una peor en esta transición.
Ahora podemos
definir la resistencia de pasar de x a y a través de S:
Si yS
AS,
rS(x,y) = ∞;
Si yS
AS,
rS(x,y) = λnW +
nI .
Una vez que
calculamos así la resistencia de toda transición, llegamos a obtener la
resistencia de la transición x→ y como la
resistencia del camino más barato, esto es, la mínima resistencia total de toda
transición x→ y:
x→S0 z1 → S1 ... zk → Sk y.
Con el
cuidadoso cálculo de tales resistencias, en este modelo se puede demostrar el
siguiente resultado:
Teorema. Sea
una economía de intercambio de casas, y sea
λ>|N|−2. Entonces, la única
asignación estocásticamente estable de
es la asignación competitiva ω.
Podemos
concluir con una breve idea de la demostración. Para cada x≠ω, la transición x→ω solamente
encuentra resistencias asociadas a indiferencias (recordemos la parte (iii) del
lema). Por tanto, esto produce una resistencia que a lo sumo es |N|−2. Sin embargo, en la transición opuesta, ω→x, al menos un
individuo debe empeorar estrictamente (parte (ii) del lema), lo cual implica
que la resistencia de tal transición es al menos λ. Poniendo los
dos argumentos juntos, se puede probar que la asignación competitiva es la
única estocásticamente estable, pero hemos llegado a ella sin ninguna apelación
a precios de mercado.
Reconocimientos
El autor agradece la
hospitalidad del CEMFI en Madrid.
Bibliografía
[1] A. Ben-Shoham, R. Serrano, O. Volij:
The evolution of exchange. Journal of Economic Theory 114 (2004), 310-328.
[2] F.Y. Edgeworth: Mathematical
Psychics. Kegan Paul Publishers, London, 1881.
[3] A.M. Feldman: Recontracting stability,
Econometrica 42, (1974),
35-44.
[4] D.P. Foster, H.P. Young: Stochastic
evolutionary game dynamics. Theoretical Population Biology 38 (1990), 219-232.
[5] M. Freidlin, A. Wentzell: Random
Perturbations of Dynamical Systems. Springer-Verlag, Berlin, 1984.
[6] J.R. Green: The stability of
Edgeworth's recontracting process. Econometrica 42 (1974), 21-34.
[7] M. Kandori, G. Mailath, R. Rob:
Learning, mutations and long run equilibria in games. Econometrica 61 (1993), 29-56.
[8] M. Kandori, R. Serrano, O.Volij:
Decentralized trade, random utility and the evolution of social welfare.
Aparecerá en Journal of Economic Theory.
[9] A.E. Roth, A. Postlewaite: Weak versus
strong domination in a market for indivisible goods. Journal of Mathematical
Economics 4 (1977), 131-137.
[10] R. Serrano, O. Volij: Mistakes in cooperation: the stochastic
stability of Edgeworth's recontracting. Working Paper 2003-23, Department
of Economics, Brown University.
[11] L.S. Shapley, H. Scarf: On cores
and indivisibility. Journal of Mathematical Economics 1 (1974), 23-28.
[12] H. P. Young: The evolution of
conventions. Econometrica 61 (1993),
57-84.
[13] H.P. Young: Individual Strategy
and Social Structure: an Evolutionary Theory of Institutions. Princeton University
Press, Princeton, NJ, 1998.
|
Sobre el autor
|

|
Roberto Serrano es Harrison S. Kravis University Professor of
Economics en Brown University (Providence, Rhode Island, USA), y profesor de
investigación en IMDEA-Ciencias Sociales (Madrid, España). Se doctoró en
Economía por la Universidad de Harvard en 1992. Ha sido profesor visitante en
el Center for Rationality de la Hebrew University of Jerusalem, Universitat
Pompeu Fabra, Institute for Advanced Study de Princeton, Universidad Carlos
III de Madrid, y CEMFI. Sus áreas de interés son la microeconomía y la teoría
de juegos. Ha hecho importantes contribuciones a la teoría de la implementación
y diseño de mecanismos, teoría de subastas y negociaciones, economía de la
incertidumbre y de la información, y teoría del equilibrio económico general.
Ha recibido numerosos premios y galardones por su investigación, incluyendo
el Premio de la Fundación Banco Herrero al mejor economista español menor de
40 años (2004), la Alfred P. Sloan Foundation Research Fellowship (1998), la
Harvard Graduate School of Arts and Sciences Merit Fellowship (1991), y
premios de la ONCE en 1993 and 1988. Su investigación ha sido subvencionada
por varias instituciones, incluyendo la US National Science Foundation, US-Israel
Binational Science Foundation, Fulbright Foundation, Fundación Ramón Areces,
Ministerio de Educación y Ciencia y Dirección General de Investigaciones
Científicas y Técnicas. Recibió el William McLaughlin Award a la excelencia
docente en Ciencias Sociales en la Brown University en 1999, y el Omicron-Delta-Epsilon
Economics Professor of the Year Award en 2006.
|