ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

En la programación dinámica probabilística, el estado en la etapa siguiente nos queda completamente determinado por el estado y la decisión de la subpolítica en el estado actual

Angie Ortiz GiraldoTarea9 de Noviembre de 2015

4.598 Palabras (19 Páginas)933 Visitas

Página 1 de 19

EJERCICIOS

PROGRAMACIÓN DINÁMICA PROBABILÍSTICA

Octubre de 2015

Investigación de Operaciones II-Grupo 9 

Mónica Patricia Novoa      Cód: 20131020072

Angie Lorena Cárdenas    Cód: 20131020082

Steve Aguilar Uribe           Cód: 20122020032

  Angie Ortiz Giraldo           Cód: 20112020071

Objetivo: 

Proponer, plantear y desarrollar ejercicios de Programación Dinámica Probabilística  mostrando paso a paso el proceso para abordar y solucionar el problema planteado.

Programación Dinámica Probabilística:

En la programación dinámica probabilística, el estado en la etapa siguiente nos queda completamente determinado por el estado y la decisión de la subpolítica en el estado actual, sino que existe una distribución de probabilidad para lo que sería el estado siguiente

Carácter probabilístico: El carácter probabilístico se ve reflejado en que los retornos y estados adoptados en cada etapa tienen asociada una probabilidad de ocurrencia; esto quiere decir que el estado en la siguiente etapa no estará completamente determinado por el estado y la política de decisiones en la etapa actual, en cambio hay una distribución de probabilidad para determinar un grado probabilidad de ocurrencia en el estado siguiente basado en el estado y política del estado actual.  

Recursividad Los cálculos de programación dinámica se hacen en forma recursiva, ya que la solución óptima de un sub-problema se usa como condición inicial para el siguiente subproblema. Para cuando se resuelve el último subproblema queda a la mano la solución óptima de todo el problema la cual contempla una política de decisiones etapa a etapa, en donde considera el resultado obtenido (el cual depende de su probabilidad de ocurrencia y sobre él se construye dicha política).

Con las recursiones en avance y en reversa se obtiene la misma solución. Aunque el procedimiento en avance parece más lógico, en las publicaciones sobre programación dinámica se usa la recursión en reversa de modo invariable. La razón de esta preferencia es que, en general, la recursión en reversa es más eficiente, desde el punto de vista computacional

Algoritmo solución:

1)División del problema en subproblemas

2)Planteamiento de la relación recursiva

3) Inicio en la etapa n (siendo n un sub-problema), considerando las limitaciones que den lugar en dicha etapa, para tomar la decisión correspondiente, escogiendo aquella que represente el retorno óptimo

4) Desarrollar el problema hasta la n-ésima etapa reconstruyendo los retornos de acuerdo a la etapa  anterior

5)Desarrollar hasta la etapa 1 (generalmente se desarrolla en retroceso )y concluir con los retornos de las etapas anteriores para poder hallar la solución óptima de acuerdo con los requerimientos del problema

Ejercicios:

Pasos

Procedimiento

Ejercicio N° 1

Enunciado

Una joven emprendedora experta en estadística cree haber desarrollado un sistema para ganar un popular juego en Las vegas. Sus colegas no piensan que este sistema sea tan bueno, por lo que le apuestan que si comienza con tres fichas, ella no tendrá al menos cinco fichas después de tres jugadas. Cada jugada incluye apostar cualquier cantidad de las fichas disponibles y ganar o perder este mismo número de fichas. La joven cree que su sistema dará probabilidad de 2/3 de ganar una jugada dada.

Suponiendo que la experta estadística está en lo correcto se quiere usar programación dinámica para determinar su política óptima sobre cuántas fichas apostar (si apuesta alguna) en cada una de tres jugadas para determinar. La decisión en cada jugada deberá tomar en cuenta los resultados de las jugadas anteriores. El objetivo es maximizar la probabilidad de ganar la apuesta hecha a sus colegas:

Objetivo

Maximizar la probabilidad de que la joven gane la apuesta

Formulación

Etapas n=(1,2,3)

Xn= Número de fichas que debe apostar en la etapa n

Sn= Número de fichas que se tienen para comenzar la etapa n.

La función objetivo que debe maximizarse en cada etapa es la probabilidad con más de cinco fichas o con justo cinco fichas, ya que la apuesta se gana de las dos formas

fn(Sn,Xn)= Probabilidad de terminar las tres jugadas con cinco fichas o más.

Planteamiento matemático

[pic 1]

Dado que la joven comienza la etapa  n con con S fichas, su decisión inmediata es Xn y en adelante toma decisiones óptimas

[pic 2]

 [pic 3]

La expresión , refleja el hecho de que un momento dado es posible acumular aun cuando pierda en la siguiente jugada.[pic 4]

- Si pierde:

El estado en la siguiente será  y la probabilidad de terminar con menos de cinco fichas será .[pic 5]

- Si gana:

El estado del sistema será y la probabilidad correspondiente será [pic 6][pic 7]

Así, se supone que la probabilidad de ganar una jugada dada es , se concluye que:Etapa [pic 8]

n=3

[pic 9]

[pic 10]

[pic 11]

[pic 12]

0

0

-

1

0

-

2

0

-

3

[pic 13]

2 o 3

4

[pic 14]

1(o más)

[pic 15]

1

0

Etapa

n=2

[pic 16]

[pic 17]

[pic 18]

[pic 19]

[pic 20]

[pic 21]

0

1

2

3

4

0

0

0

-

1

0

0

0

-

2

0

4/9

4/9

4/9

1 o 2

3

[pic 22]

4/9

2/3

2/3

2/3

0,2 o 3

4

[pic 23]

8/9

2/3

2/3

2/3

8/9

1

[pic 24]

1

1

0

Etapa

n=1

[pic 25]

[pic 26]

[pic 27]

[pic 28]

[pic 29]

0

1

2

3

3

2/3

20/27

2/3

2/3

20/27

1

Resultado del Problema

Si gana :[pic 30]

-Si gana               -Si pierde [pic 31][pic 32]

Si pierde [pic 33]

Si gana [pic 34]

                                          [pic 35]

Si pierde, la apuesta está perdida.

  • Esta política plantea una probabilidad de  de ganar las apuestas a sus colegas.[pic 36]

Conclusiones:

  • A diferencia de la programación dinámica determinística en la programación dinámica probabilística se consideran los resultados posibles que arroje el problema dados por las probabilidades asociadas al problema.
  • La PDP es una herramienta útil a la hora de predecir resultados debido a que se manejan probabilidades en vez de valores determinados.
  • Esta programación resulta muy útil cuando los problemas tienen un nivel de incertidumbre alto.

Referencias:

  • http://htomadedecisiones.blogspot.com.co/2013/09/ejercicio-2.html
  • Notas de clase. Profesora: Lilian Astrid Bejarano Garzón.

Pasos

Procedimiento

Ejercicio N° 2

Enunciado

Suponga que el perímetro de la rueda de la ruleta rusa está marcado con los números 1 a 5. La probabilidad de detenerse en el número i es

       P1 = 0.3      P2 = 0.25     P3 = 0.2      P4 = 0.15        P5 = 0.1

El  jugador paga $5 para hacer un máximo de cuatro giros. Determine la estrategia óptima para cada uno de los cuatro giros, y el ingreso neto esperado correspondiente.

Objetivo

Maximizar

Formulación

  1. La etapa i  se representa con el giro i, i = 1, 2,…., m.
  2. las    alternativas        en cada etapa incluye hacer girar la rueda una vez más o terminar el juego.
  3. El  estado j  del sistema en la  etapa i  se representa con uno de los números de 1 a n que se haya obtenido en el  último  giro

Etapa 5                  

f5(j) = 2j

Etapa 4

F4 (j) = máx. 2j, P1 f5 (1) + P2 f5 (2) + P3 f5 (3) + P4 f5 (4) + P5 f5 (5)=

Reemplazando,

máx. 2j, 0.3 X 2 + 0.25 X 4 + 0.2 X 6 +0.15 X 8 + 0.1 X 10  =

máx.  2j, 5

Resultado j del giro 3

Ingreso esperado

Solución Óptima

Terminar

Girar

F4(j)

Decisión

1

2

5

5

Girar

2

4

5

5

Girar

3

6

5

6

Terminar

4

8

5

8

Terminar

5

10

5

10

Terminar

...

Descargar como (para miembros actualizados) txt (32 Kb) pdf (671 Kb) docx (408 Kb)
Leer 18 páginas más »
Disponible sólo en Clubensayos.com