ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Refinamientos del equilibrio de Nash

Esteban Moreno CedielDocumentos de Investigación14 de Diciembre de 2017

6.790 Palabras (28 Páginas)462 Visitas

Página 1 de 28

Resumen: Esta entrada describe las formas en que la definición de equilibrio entre las estrategias de los jugadores en un juego se puede agudizar mediante la invocación de criterios adicionales derivados de la teoría de la decisión. Los refinamientos de la definición de 1950 de John Nash apuntan principalmente a distinguir los equilibrios en los cuales los compromisos implícitos son creíbles debido a los incentivos. Un grupo de refinamientos requiere racionalidad secuencial a medida que el juego avanza. Otro asegura credibilidad al considerar juegos perturbados en los que cada contingencia ocurre con probabilidad positiva, que tiene la ventaja adicional de excluir estrategias dominadas débilmente.

Refinamientos del equilibrio de Nash

La teoría de juegos estudia las decisiones de varias personas en situaciones con interacciones significativas. En comparación con otras teorías de decisiones de múltiples personas, tiene dos características distintivas. Una es la consideración explícita de las estrategias disponibles de cada persona y los resultados resultantes de las combinaciones de sus elecciones; es decir, una especificación completa y detallada del "juego". En contextos no cooperativos, el otro se centra en las elecciones óptimas de cada persona por separado. John Nash (1950, 1951) propuso que una combinación de estrategias mutuamente óptimas se puede caracterizar matemáticamente como un equilibrio. Según la definición de Nash, una combinación es un equilibrio si la elección de cada persona es una respuesta óptima a las elecciones de los demás. Su definición asume que una elección es óptima si maximiza la utilidad esperada de los resultados de la persona, condicionada a conocer o anticipar correctamente las elecciones de los demás. En algunas aplicaciones, el conocimiento de las opciones de los demás puede provenir de un acuerdo o comunicación previa, o la predicción precisa de las elecciones de los demás puede derivar del "conocimiento común" de las estrategias y los resultados, y de la optimización del comportamiento. Debido a que muchos juegos tienen equilibrios múltiples, las predicciones obtenidas son incompletas. Sin embargo, el equilibrio es un criterio débil en algunos aspectos, y por lo tanto uno puede refinar el criterio para obtener predicciones más nítidas (Harsanyi y Selten, 1988; Hillas y Kohlberg, 2002; Kohlberg, 1990; Kreps, 1990).

Aquí describimos los principales refinamientos del equilibrio de Nash utilizados en las ciencias sociales. Los refinamientos se desarrollaron de manera incremental, a menudo basándose en criterios ad hoc, lo que hace que sea difícil para un no especialista apreciar lo que se ha logrado. Se han propuesto muchos refinamientos pero solo describimos los más destacados. Primero describimos brevemente los refinamientos que seleccionan equilibrios con características simples, y luego nos enfocamos principalmente en aquellos que invocan principios básicos adaptados de la teoría de decisión de una sola persona.

Equilibrios con características simples

La construcción de Nash permite que cada persona elija al azar entre sus estrategias, pero la aleatorización no siempre es plausible. Los equilibrios en estrategias "puras" son aquellos que no usan la aleatorización. De manera similar, los equilibrios estrictos son aquellos para los cuales cada persona tiene una estrategia óptima única en respuesta a las estrategias de los demás. En juegos con algunas simetrías entre los jugadores, los equilibrios simétricos son aquellos que reflejan estas simetrías. En las aplicaciones a las interacciones dinámicas, los equilibrios más útiles son aquellos que, en cada etapa, dependen solo de la parte de la historia previa que sea relevante para los resultados en el futuro. En particular, cuando la dinámica del juego es estacionaria uno selecciona equilibrios que son estacionarios, o que son Markovianos en el sentido de que dependen únicamente de variables de estado que resumen la historia relevante para el futuro. Las aplicaciones para la informática seleccionan equilibrios, o más a menudo equilibrios aproximados, utilizando estrategias que pueden implementarse mediante algoritmos simples. Particularmente útiles son los equilibrios que se basan solo en la memoria limitada de eventos y acciones pasadas y así economizan en la memoria o la computación.

Refinamientos que requieren estrategias para ser admisibles

Una estrategia está estrictamente dominada por otra si produce resultados estrictamente inferiores para esa persona, independientemente de las elecciones de los demás. Debido a que un equilibrio nunca usa una estrategia estrictamente dominada, los mismos equilibrios persisten cuando se eliminan las estrategias estrictamente dominadas, pero después de la eliminación puede ocurrir que algunas estrategias restantes queden estrictamente dominadas. Un criterio que explota esta característica elimina las estrategias estrictamente dominadas hasta que no quede ninguna, y luego selecciona los equilibrios que permanecen en el juego reducido. Si un solo equilibrio sobrevive, el juego se llama dominancia resoluble. Un equilibrio puede, sin embargo, utilizar una estrategia que está débilmente dominada en el sentido de que estaría estrictamente dominada si no fuera por los lazos: en la teoría de la decisión, tal estrategia se dice que es inadmisible. Un criterio prominente selecciona equilibrios que usan solo estrategias admisibles, y a veces esto se fortalece mediante la eliminación iterativa de estrategias estrictamente dominadas después de eliminar las estrategias inadmisibles. Un refinamiento más fuerte utiliza la eliminación iterativa de estrategias (estrictas y débiles) dominadas hasta que no quede ninguna; sin embargo, este procedimiento es ambiguo porque el resultado final puede depender del orden en que se eliminen las estrategias débilmente dominadas. Un orden particular se usa para juegos dinámicos que se descomponen en una sucesión de subjuegos a medida que pasa el tiempo. En este caso, aquellas estrategias que están débilmente dominadas porque están estrictamente dominadas en los subjuegos finales se eliminan primero, luego en los penúltimos subjuegos, etc. En los juegos con "información perfecta" como se define a continuación, este procedimiento implementa el criterio llamado inducción regresiva y el los equilibrios que sobreviven se encuentran entre aquellos que son perfectos en el subjuego (Selten, 1965). En general, un equilibrio en subjuego perfecto es aquel que induce un equilibrio en cada subjuego. El criterio informal de inducción directa tiene varias formulaciones. Kohlberg y Mertens (1986) requieren que un conjunto refinado de equilibrios contenga un subconjunto que sobreviva a la eliminación de estrategias que no son respuestas óptimas en ningún equilibrio en el conjunto. Van Damme (1989, 1991) requiere que si el jugador 1 rechaza una opción A en favor de B o C, entonces otro jugador que solo sabe que B o C fue elegido debería considerar C poco probable si se elige solo en equilibrios que produzca resultados para el jugador 1 peor que elegir A, mientras que B se elige en un equilibrio cuyo resultado es mejor. Una aplicación típica imita la inducción hacia atrás pero a la inversa: si una persona rechazaba previamente una opción con un resultado que hubiera sido superior en comparación con los resultados de todos menos un equilibrio del subsiguiente subjuego, entonces presumiblemente la persona anticipa ese equilibrio favorable y tiene la intención usar su estrategia en ese equilibrio del subjuego.

Juegos dinámicos

Antes de continuar, describimos brevemente algunas características relevantes de los juegos dinámicos; es decir, juegos en los que un jugador actúa repetidamente, y puede hacer inferencias sobre las estrategias, preferencias o información privada de los demás a medida que avanza el juego. Se dice que un juego dinámico tiene "información perfecta" si cada persona conoce inicialmente todos los datos del juego, y el historial previo de las acciones de él y de los demás cuando realiza una acción, y no actúan simultáneamente. En dicho juego, cada acción inicia un subjuego; de ahí que la inducción hacia atrás produzca un equilibrio perfecto en subjuegos perfectos si no hay lazos. Pero en muchos juegos dinámicos no hay subjuegos. Esto es así cada vez que una persona actúa sin conocer todos los datos del juego relevantes para el futuro. La fuente de esta deficiencia es típicamente que algún participante tiene información privada; por ejemplo, sus propias preferencias o información sobre los resultados, o porque sus acciones son observadas imperfectamente por otros. Entre los juegos de salón, el ajedrez es un juego con información perfecta (si los jugadores recuerdan si cada rey ha sido enrocado). Bridge y poker son juegos con información imperfecta porque las cartas en la mano de un jugador no son conocidas por los demás cuando apuestan. En entornos prácticos, las subastas y las negociaciones se asemejan al póker porque cada parte actúa (ofertas, ofertas, etc.) sin conocer las valoraciones de los demás de la transacción. Los análisis de juegos económicos prácticos generalmente asumen (como lo hacemos aquí) un "recuerdo perfecto" en el sentido de que cada jugador siempre recuerda lo que sabía e hizo previamente. Si Bridge se trata como un juego de dos jugadores entre equipos, tiene un recuerdo imperfecto porque cada equipo recuerda alternativamente y luego olvida las cartas en la mano de un miembro mientras la puja va por la mesa, pero Bridge tiene un recuerdo perfecto si se trata como una juego para cuatro jugadores. En los juegos de cartas como el bridge y el póquer, cada jugador puede derivar la distribución de probabilidad de las cartas de otros partiendo de la suposición de que el mazo de cartas fue completamente barajado. Los modelos de juegos económicos imponen suposiciones análogas; Por ejemplo, un modelo de una subasta supone que cada postor evalúa inicialmente una distribución de probabilidad de las valoraciones de los demás del artículo en venta, y luego actualiza esta evaluación cuando observa sus ofertas. Más realismo se obtiene de escenarios más complicados; por ejemplo, podría ser que el jugador A no esté seguro acerca de la evaluación del jugador B de la valoración del jugador A. En principio, el modelo podría permitir una jerarquía de creencias: la evaluación de probabilidad de A de la evaluación de B de la evaluación de A de .... Adoptando una propuesta de John Harsanyi (1968) desarrollada por Mertens y Zamir (1985), tales situaciones se modelan asumiendo que cada jugador es uno de varios tipos. La distribución conjunta inicial de tipos es comúnmente conocida entre los jugadores, pero cada jugador conoce su propio tipo, que incluye una especificación de sus estrategias disponibles, sus preferencias sobre los resultados, y lo más importante, su evaluación de las probabilidades condicionales de los tipos de los otros su propio tipo. En el póquer, por ejemplo, el tipo de jugador incluye la mano de las cartas que le reparten, y su mano afecta sus creencias sobre las manos de los demás. Los refinamientos del equilibrio de Nash son especialmente útiles en los juegos dinámicos. Los equilibrios de Nash no distinguen entre el caso en el que cada jugador se compromete inicialmente e irrevocablemente con su estrategia a lo largo del juego, y el caso en el que un jugador se vuelve a optimizar continuamente a medida que avanza el juego. La distinción se pierde porque la definición de equilibrio de Nash supone que los jugadores seguramente se apegarán a sus estrategias elegidas inicialmente. La mayoría de los refinamientos del equilibrio de Nash intentan resucitar esta importante distinción. Lo ideal sería que cada equilibrio de Nash llevara una etiqueta que diga si asume un compromiso implícito o si se basa en amenazas o promesas increíbles. Tales características son usualmente evidentes en el equilibrio de juegos trivialmente simples, pero en juegos más complicados deben identificarse aumentando la definición de equilibrio de Nash con criterios adicionales. En la continuación describimos dos clases de refinamientos en detalle, pero primero resumimos sus características principales, identificamos los principales criterios de selección que usan y mencionamos los nombres de algunos refinamientos específicos. Ambas clases son generalizaciones de inducción hacia atrás y perfección de subjuegos, y obtienen resultados similares, pero su motivación e implementación difieren.

...

Descargar como (para miembros actualizados) txt (44 Kb) pdf (221 Kb) docx (23 Kb)
Leer 27 páginas más »
Disponible sólo en Clubensayos.com