El Principio de Optimalidad y Perfección en Subjuegos
Josue JacomeEnsayo11 de Noviembre de 2022
4.461 Palabras (18 Páginas)86 Visitas
Resumen Capitulo 4 Tirole
El Principio de Optimalidad y Perfección en Subjuegos
Para poder analizar si un perfil de estrategia de un juego con varias etapas y con acciones observadas es perfecto en subjuegos, es necesario comprobar si existe un historian en el que algún individuo pueda desviarse de las acciones prescritas por Si y con ello lograr ganar.
El principio de desviación de una etapa es el principio de optimización de la programación dinámica que ayuda a enseñar la idea de inducción hacia atrás. El teorema 4.1 nos menciona que en un juego finito de múltiples etapas con acciones observadas, el perfil de estrategia s es perfecto en subjuegos si y solo si il satisface la condición de desviación de una etapa de que ningún jugador puede ganancia al desviarse de s en una sola etapa y ajustarse a s a partir de entonces. Más precisamente, el perfil s es perfecto en subjuegos si y solo si no hay un jugador i con una estrategia que concuerde con Si excepto en un solo r y ht, y tal que sea una respuesta más falsa a s que condicionada a que se alcance la historia ht.
La prueba anterior deja abierta la posibilidad de que el jugador i pueda ganar por una secuencia infinita de desviaciones, aunque no puede ganar por una sola desviación en ningún subjuego.
El teorema 4.2 nos menciona que en un juego de múltiples etapas de horizonte infinito con acciones observadas que es continuo en el infinito, el perfil s es subjuego perfecto si y solo si no hay un jugador i y una estrategia que coincida con Si excepto en una sola t y ht, y tales que[pic 1]es una mejor respuesta a que Si condicional a la historia h! siendo alcanzado.
La demostración de este último teorema establece la necesidad y también muestra que si s satisface la condición de desviación de una etapa, entonces no puede mejorarse mediante ninguna secuencia finita de desviaciones en ningún subjuego.
Por el contrario, que s no fueran perfectos en subjuegos. Entonces, habría una etapa y una historia h1 donde algún jugador i podría mejorar su utilidad usando una estrategia diferente en el subjuego comenzando en ht Sea la cantidad de esta mejora E > 0.
El dilema del prisionero repetido
Se analiza la forma en que el juego repetido introduce nuevos equilibrios al permitir que los jugadores condicionen sus acciones a la forma en que jugaron sus oponentes en períodos anteriores
[pic 2]
Se desea considerar cómo varían los pagos de equilibrio con el horizonte T. Para hacer que los pagos de diferentes horizontes sean comparables, normalizamos para expresarlos en las unidades utilizadas para los pagos por período, de modo que la utilidad de una secuencia {ao[pic 3]. A esto se le conoce como el pago descontado promedio.
Se varia el factor de descuento y el horizonte temporal, midiendo todos los pagos en términos de promedios por período.
Si se juega una sola vez la cooperación estará fuertemente dominada y el único equilibrio es que ambos jugadores deserten. Si el juego se repite un número finito de veces, la perfección en subjuegos requiere que ambos jugadores deserten en el último período, y la inducción hacia atrás implica que el único equilibrio perfecto en subjuegos es que ambos jugadores deserten en cada período. Si el juego se juega infinitamente a menudo, entonces ambos desertan cada período y sigue siendo un equilibrio perfecto en subjuegos. Además, es el único equilibrio con la propiedad de que el juego en cada etapa no varía con las acciones jugadas en etapas anteriores Si se tiene un horizonte infinito entonces se tendrá que se coopere en el primer periodo y se siga esta sucesión e igual si descartan. Entonces hay dos clases de subjuegos; la clase A, en la que ningún jugador ha desertado, y la clase B, en la que se ha producido una deserción.
Juego Finitamente Repetido con Varios Equilibrios Estáticos
Para los factores de descuento pequeños, la ganancia a corto plazo de desviarse necesariamente excede cualquier pérdida a largo plazo que este comportamiento pueda generar.
Estas estrategias especifican un equilibrio de Nash en la segunda etapa. Desviarse en la primera etapa aumenta el pago actual en 1 y reduce los pagos de continuación para los jugadores 1 y 2 respectivamente de 4 o 3 a 12/7.
El modelo de negociación de Rubinstein-Stahl
Aquí hay un equilibrio perfecto en subjuegos de este modelo: El jugador i siempre demanda una parte [pic 4]cuando le toca a il hacer una oferta. Acepta cualquier parte igual o mayor que [pic 5]y rechaza cualquier parte menor". Tenga en cuenta que la demanda del jugador i de
[pic 6]
es la participación más alta para el jugador i que acepta el jugador j. Jugador que no puedo ganar haciendo una oferta más baja, porque también será aceptada. Hacer una oferta más alta y esperar para aceptar la oferta del jugador _j en el próximo período perjudica al jugador i, ya que
[pic 7]
De manera similar, es óptimo que el jugador i acepte cualquier oferta de al menos [pic 8] [pic 9] y 10 rechaza acciones inferiores, ya que si rechaza recibe la acción [pic 10]próximo período.
. Con un horizonte finito, el juego se resuelve fácilmente por inducción hacia atrás: el único equilibrio perfecto en subjuegos en el último período es que el jugador que hace la oferta , se supone que es el jugador l, y exige todo el pastel, y su oponente para aceptar esta demanda.
El modelo de horizonte finito tiene dos inconvenientes potenciales en relación con el modelo de horizonte infinito. Primero, la solución depende de la duración del juego y de qué jugador hace la última oferta; sin embargo, esta dependencia se vuelve pequeña a medida que el número de períodos crece hasta el infinito. En segundo lugar, y más importante, la suposición de un último período significa que si se rechaza la última oferta, los jugadores no pueden continuar tratando de llegar a un acuerdo.
Estática comparativa
El primer jugador del juego va a tener una ventaja competitiva, eso no quiere decir que el segundo jugador necesariamente tenga malos resultados en sus pagos finales. Pero, la ventaja de ser el primero en moverse desaparece si consideramos que los periodos de tiempo son arbitrariamente cortos
Juegos de cronometraje simples. En un juego de cronometraje simple, la única opción de cada jugador es cuándo elegir la acción parar, y una vez que un jugador se detiene, no tiene ningún efecto en el juego futuro. Eso es. si el jugador i no se ha detenido en ningún T < t, su acción establecida en t es. [pic 11](detente, no te detengas) si el jugador i se ha detenido en algo < 1, entonces Ai(t) es la acción nula "no moverse". Al considerar los equilibrios perfectos en subjuegos, primero podemos plegar hacia atrás los subjuegos en los que un jugador se ha detenido y luego pasar a los subjuegos en los que ninguno de los jugadores se ha detenido todavía. Esto nos permite expresar los pagos de ambos jugadores como funciones del tiempo.
La guerra o el desgaste
El ejemplo consiste en que dos animales luchan por un premio, si un animal deja de pelear en el primer periodo, su oponente gana el premio sin incurrir en un costo. Si ambos paran simultáneamente ninguno gana el premio.
Los jugadores tienen la libertad de retirarse cuando lo deseen y no se comprometen a cumplir con su elección de fecha y hora de finalización, ¿quieren desviarse? La respuesta es No: Todos los equilibrios de Nash estacionarios, es decir, equilibrios con estrategias que son independientes del tiempo del calendario son perfectos en subjuegos. la guerra de desgaste tiene un equilibrio simétrico en el tipo de estrategias de tiempo continuo y este equilibrio es el límite de los equilibrios simétricos del juego de tiempo discreto. el equilibrio simétrico en tiempo discreto converge al equilibrio simétrico en tiempo continuo cuando A tiende a 0.
Ejemplo de continuación eventual Fudenberg
En este ejemplo dos empresas participan en una carrera de patentes y detenerse significa abandonar la carrera. La productividad esperada de la investigación es inicialmente baja, de modo que si ambas empresas hacen I+D hasta que una de ellas hace un descubrimiento, ambas empresas tienen un valor esperado negativo. Sin embargo, la productividad de I+D aumenta con el tiempo, por lo que hay tiempos T: y 'I; tal que, si ambas empresas siguen activas en Ti. entonces es una estrategia dominante para la empresa i nunca detenerse.
[pic 12]
Supuestos del juego
[pic 13]
[pic 14]
[pic 15]
[pic 16]
Como resultado se tiene que siempre obtiene más al nunca darse por vencido. Por lo tanto, dejar de fumar es una estrategia estrictamente dominada en la fecha t > Ti. Supongamos ahora que los tiempos (Tl, T2) definidos en la condición vi satisfacen Tl + I < T2.
Juegos de preferencia
Los juegos de preferencia son todo lo contrario a la guerra de desgaste, con L(i) > F(i) para algún rango de tiempos i. Aquí la especificación de la recompensa por detenerse simultáneamente, B(•), es más importante que en la guerra de desgaste, ya que si L excede a F, podríamos esperar que ambos jugadores se detuvieran simultáneamente.
...