TEOTIA DE JUEGOS
aliiz14529 de Mayo de 2014
4.240 Palabras (17 Páginas)290 Visitas
TEORIA DE JUEGOS
DEFINICION:
La Teoría de Juegos fue creada por Von Neumann y Morgenstern en su libro clásico The Theory of Games Behavior, publicado en 1944. Otros habían anticipado algunas ideas.Los economistas Cournot y Edgeworth fueron particularmente innovadores en el siglo XIX. Otras contribuciones posteriores mencionadas fueron hechas por los matemáticos Borel y Zermelo. El mismo Von Neumann ya había puesto los fundamentos en el artículo publicado en 1928. Sin embargo, no fue hasta que apareció el libro de Von Neumann y Morgenstern que el mundo comprendió cuán potente era el instrumento descubierto para estudiar las relaciones humanas.
La teoría de juegos es un área de la matemática aplicada que utiliza modelos para estudiar interacciones en estructuras formalizadas de incentivos (los llamados «juegos») y llevar a cabo procesos de decisión. Sus investigadores estudian las estrategias óptimas así como el comportamiento previsto y observado de individuos en juegos. Tipos de interacción aparentemente distintos pueden, en realidad, presentar estructura de incentivo similar y, por lo tanto, se puede representar mil veces conjuntamente un mismo juego. La teoría de juegos estudia decisiones realizadas en entornos donde se interaccionan. En otras palabras, estudia la elección de la conducta óptima cuando los costes y los beneficios de cada opción no están fijados de antemano, sino que dependen de las elecciones de otros individuos.
REPRESENTACION DE JUEGOS
Los juegos estudiados por la teoría de juegos están bien definidos por objetos matemáticos. Un juego consiste en un conjunto de jugadores, un conjunto de movimientos (o estrategias) disponible para esos jugadores y una especificación de recompensas para cada combinación de estrategias. Hay dos formas comunes de representar a los juegos.
FORMA NORMAL DE UN JUEGO
La forma normal (o forma estratégica) de un juego es una matriz de pagos, que muestra los jugadores, las estrategias, y las recompensas (ver el ejemplo a la derecha). Hay dos tipos de jugadores; uno elige la fila y otro la columna. Cada jugador tiene dos estrategias, que están especificadas por el número de filas y el número de columnas. Las recompensas se especifican en el interior. El primer número es la recompensa recibida por el jugador de las filas (el Jugador 1 en nuestro ejemplo); el segundo es la recompensa del jugador de las columnas (el Jugador 2 en nuestro ejemplo). Si el jugador 1 elige arriba y el jugador 2 elige izquierda entonces sus recompensas son 4 y 3, respectivamente.
Cuando un juego se presenta en forma normal, se presupone que todos los jugadores actúan simultáneamente o, al menos, sin saber la elección que toma el otro. Si los jugadores tienen alguna información acerca de las elecciones de otros jugadores el juego se presenta habitualmente en la forma extensiva.
También existe una forma normal reducida. Ésta combina estrategias asociadas con el mismo pago.
FORMA EXTENSIVA DE UN JUEGO
La representación de juegos en forma extensiva modela juegos con algún orden que se debe considerar. Los juegos se presentan comoárboles (como se muestra a la derecha). Cada vértice o nodo representa un punto donde el jugador toma decisiones. El jugador se especifica por un número situado junto al vértice. Las líneas que parten del vértice representan acciones posibles para el jugador. Las recompensas se especifican en las hojas del árbol.
En el juego que se muestra en el ejemplo hay dos jugadores. El jugador 1 mueve primero y elige F o U. El jugador 2 ve el movimiento deljugador 1 y elige A o R. Si el jugador 1 elige U y entonces el jugador 2 elige A, entonces el jugador 1 obtiene 8 y el jugador 2 obtiene 2.
Los juegos en forma extensiva pueden modelar también juegos de movimientos simultáneos. En esos casos se dibuja una línea punteada o un círculo alrededor de dos vértices diferentes para representarlos como parte del mismo conjunto de información (por ejemplo, cuando los jugadores no saben en qué punto se encuentran).
La forma normal da al matemático una notación sencilla para el estudio de los problemas de equilibrio, porque desestima la cuestión de cómo las estrategias son calculadas o, en otras palabras, de cómo el juego es jugado en realidad. La notación conveniente para tratar estas cuestiones, más relevantes para la teoría combinatoria de juegos,
TIPOS Y EJEMPLOS DE JUEGOS
EL DILEMA DEL PRISIONERO Y EL "EQUILIBRIO DE NASH"
La "Teoría de Juegos" clasifica a los diferentes tipos de juegos en categorías en función del método que hay que aplicar para resolverlos. De esta forma existen:
- Juegos simétricos y asimétricos.
- Juegos de suma cero y de suma no cero.
- Criterios "maximin" y "minimax".
- "Equilibrio de Nash" (o "equilibrio de Nash-Cournot").
- Juegos cooperativos.
- Juegos simultáneos y secuenciales.
- Juegos de información perfecta.
- Juegos de información infinita ("Superjuegos").
El llamado "Dilema del prisionero" es uno de los ejemplos más conocidos dentro de la categoría de juegos del tipo "Equilibrio de Nash" (economista que desarrolló esta teoría, y cuya vida fue por cierto llevada al cine en la película "Una Mente Maravillosa" siendo interpretado por Russel Crowe). En él se analizan los incentivos que tienen 2 presos encarcelados por un delito menor para delatar al otro a la policía y acceder así a beneficios penitenciarios, teniendo siempre en cuenta la decisión que podría tomar el otro:.
Este ejercicio considera el supuesto de que cada prisionero está encarcelado por separado, de tal forma que no pueden comunicarse entre ellos, ponerse de acuerdo, pactar sus decisiones o saber qué hace el otro.
Las posibilidades de condena en función de la decisión tomada por ambos son las siguientes:
a) NADIE DELATA: si ninguno de los dos delatase al otro a la policía, entonces cada uno recibiría una condena de 2 años: (-2, -2).
b) UNO DELATA AL OTRO: si uno de los prisioneros delatase al otro, pero este otro no delatase al uno, entonces el prisionero que delata reduciría su condena hasta solo 1 año, mientras que el prisionero delatado vería incrementada su condena hasta 10 años: posibilidades (-10, -1) y (-1, -10).
c) AMBOS SE DELATAN MUTUAMENTE: si ambos deciden delatar al otro, entonces recibirán una condena de 6 años de cárcel para cada uno (-6, -6).
Juegos de suma cero de dos personas
Dos compañías de autobuses, A y B, explotan la misma ruta entre dos ciudades y están enzarzadas en una lucha por una mayor parte del mercado. Puesto que la parte total del mercado es un 100 por 100 fijo, cada punto porcentual ganado por uno debe ser perdido por el otro. Se dice que tal situación es un juego de suma cero de dos personas por las razones obvias de que el juego es jugado por dos jugadores diametralmente opuesto y que la suma de las ganancias y perdidas es siempre cero.
Si se supone que la compañía A y la compañía B esta considerando las
tres mismas estrategias para ganar una mayor parte relativa del mercado como sigue:
1.
2. a1 o b1: Sirve refrescos durante el viaje.
3. a2 o b2: Introduce autobuses con aire acondicionado.
4. a3 o b3: Anuncia diariamente en estaciones de televisión en las dos ciudades.
Por comodidad, se supone que ante de comenzar el juego ambas compañías no están asiendo ningún esfuerzo especial y comparte por igual el mercado –50 por 100 cada una. Además, si se supone también que cada compañía no puede emplear mas de uno de estas actitudes o estrategias al mismo tiempo y que las tres estrategias tienen idénticos costos.
Por estos supuestos, hay un total de 3 x 3 = 9 combinaciones posibles de movimientos, y cada una es capas de afectar a la parte del mercado en una forma especifica. Por ejemplo, si A y B sirvan refrescos durante el viaje, se dice que A perdería 10 por 100 de la parte del mercado a favor de B, lo que puede indicar que los refrescos de B son mas para los gustos de los clientes, igualmente, si A anuncio y B, por ejemplo, sirve refrescos, se supone que A ganaría 20 por 100 del mercado en perjuicio de B; evidentemente, la publicidad en televisión parece ser más eficaz que servir refrescos.
Ahora, por cada una de las 9 combinaciones puede determinar ganancias o perdidas del mercado para A como se indica en la siguiente matriz de pagos.
b1 b2 b3
a1 -10 -11 -1
a2 9 -8 -6
a3 20 -10 -13
Estrategias maximin y minimax
El enfoque conservador a la lección de la mejor estrategia es suponer lo peor y actuar de conformidad con ello. Así según este enfoque y con referencia en la matriz de pagos. Si A decide sobre la estrategia a1, supondría que B escogerá la estrategia b2, reduciendo con ello el pago a1 para A aun valor mínimo o de seguridad de –11. Análogamente, los valores de seguridad para a2 y a3 son –8 y –3, respectivamente.
Obsérvese que los valores de seguridad para los distintos movimientos que puede hacer A son los mínimos de filas. Dados estos valores mínimos, hará bien en emplear aquella estrategia que da el máximo de estos valores de seguridad mínimos. En el ejemplo A debe adoptar a2 y aspira a un pago de –8 a B. Esta regla de decisión, que conduce a la elección del mayor de los valores mínimos en que puede resultan cada estrategia, se llama estrategia maximin.
La compañía B, según esta actitud
...