DISTRIBUCIONES DE PROBABILIDAD
hkyf6Tesis6 de Mayo de 2015
4.437 Palabras (18 Páginas)275 Visitas
UNIDAD 7
DISTRIBUCIONES DE PROBABILIDAD
Una variable aleatoria es una función que asigna un número real a cada resultado del espacio muestral de un experimento aleatorio.
Dicho de otra forma, una variable aleatoria es una función valorada numéricamente, cuyo valor está regido por factores en los que interviene el azar.
Las variables aleatorias pueden ser discretas o continuas, según su rango de valores.
Una variable aleatoria que puede asumir una cantidad finita de valores o una sucesión infinita de valores enteros se llama variable aleatoria discreta. Por ejemplo, consideremos que un experimento consiste en contar los vehículos que llegan a un puesto de cobro; la variable aleatoria de interés es la cantidad de vehículos que llegan en un minuto y sus posibles valores son 0, 1, 2…
Las variables aleatorias cualitativas deben asumirse como discretas, puesto que a cada posible valor podría asignársele un número.
Una variable aleatoria es continua cuando puede tomar cualquier valor dentro de un intervalo de números reales. Por lo tanto, no es posible conocer su valor exacto.
Si la variable aleatoria es discreta, pero el rango es muy amplio, resulta más conveniente utilizar un modelo basado en variables aleatorias continuas.
Cuando la variable es continua no tiene sentido hacer una suma de las probabilidades de cada uno de los términos en el sentido anterior, ya que el conjunto de valores que puede tomar la variable es no numerable. En este caso, lo que generaliza de modo natural el concepto de suma (Σ) es el de integral (∫).
La distribución de probabilidad se describe mediante una función de probabilidad, representada por f(x).
MODELOS DE DISTRIBUCIONES
Frecuentemente las observaciones que se generan en experimentos estadísticos tienen algunos tipos generales de comportamiento, por eso sus variables se pueden describir esencialmente con unas pocas distribuciones, las cuales pueden representarse mediante una ecuación.
Frente a la complejidad de los fenómenos bajo estudio, el experimentador aproxima y hace algunos postulados tentativos acerca del mecanismo aleatorio y deriva un modelo por el empleo de esos postulados en combinación con las leyes de probabilidad.
Un modelo de probabilidad para la variable aleatoria X es una forma específica de distribución de probabilidades que es asumida para reflejar el comportamiento de X. Las probabilidades son registradas en términos de parámetros desconocidos que relacionan las características de la población y el método de muestreo.
“EL MODELO DEBE SER COHERENTE CON LA REALIDAD”
En esta unidad se examinarán detalladamente algunas distribuciones específicas de probabilidad que han demostrado, empíricamente, ser modelos útiles para diversos problemas prácticos. Pero dichas distribuciones son teóricas porque sus funciones de probabilidad se deducen matemáticamente con base en ciertas hipótesis que se suponen válidas para esos fenómenos aleatorios.
Dichas distribuciones son idealizaciones del mundo real, por lo tanto sus resultados no siempre coinciden con la realidad.
1. DISTRIBUCIÓN BINOMIAL: Se maneja cuando se satisfacen las siguientes características:
a) El experimento consiste en una sucesión de n ensayos o intentos idénticos.
b) El resultado de cada ensayo se clasifica dentro de dos categorías mutuamente excluyentes: Éxito o fracaso. El uso de esos términos es por conveniencia, pero no tienen la misma connotación de la vida real (éxito no necesariamente es lo que convenga).
c) La probabilidad de éxito permanece constante en todos los ensayos.
d) Los ensayos son independientes, lo que significa que la ocurrencia de uno de ellos no afecta el resultado de cualquier otro.
La función de probabilidad binomial puede escribirse como:
,
donde x es el número de éxitos, n el número de ensayos, p es la probabilidad de éxito y q es la probabilidad de fracaso.
A continuación se muestra la representación gráfica de una distribución binomial con valores de n y p determinados:
________________________________________
EJEMPLO 7.1.
Cierta aerolínea hace ocho vuelos diarios de Bogotá a Miami. Suponga que la probabilidad de que alguno de los vuelos se retrase es 0.2.
a) ¿Cuál es la probabilidad de que ninguno de los vuelos se retrase hoy?
b) ¿Cuál es la probabilidad de que hoy se retrasen por lo menos 6 vuelos?
Solución:
a) P(X=0) =
b) P(X≥6) = P(X=6) + P(X=7) + P(X=8)
=
= 0.00123
________________________________________
Revisemos la distribución de probabilidades de un caso binomial en el que p = 0.3 y el número de ensayos varía:
En casi todos los libros de estadística se encuentran tablas de la distribución binomial para valores seleccionados de p. Para ilustrar su uso, veamos el siguiente ejemplo:
________________________________________
EJEMPLO 7.2.
Un examen de selección múltiple contiene 20 preguntas, cada una con cuatro posibles respuestas, de las cuales sólo una es correcta. Suponga que un estudiante sólo adivina las respuestas.
a) ¿Cuál es la probabilidad de que el estudiante conteste correctamente más de la mitad de las preguntas?
b) ¿Cuál es la probabilidad de que el estudiante conteste correctamente menos de 5 preguntas?
c) ¿Cuál es la probabilidad de que el estudiante gane el examen?
d) ¿Cuál es el número esperado de respuestas correctas?
e) Responder las preguntas a) y c) si cada pregunta tiene 5 opciones.
Solución:
p = ¼ n = 20
a) P(X>10) = 1 – P(X10) = 1 – 0.9961 = 0.0039
b) P(X<5) = P(X4) = 0.4148
c) P(X12) = 1 – P(X11) = 1 – 0.9991 = 0.0009
d) = np = 20 * ¼ = 5 respuestas correctas
e) La probabilidad de éxito sería ya de 1/5, por tanto:
P(X>10) = 1 – P(X10) = 1 – 0.9994 = 0.0006
P(X12) = 1 – P(X11) = 1 – 0.9999 = 0.0001
________________________________________
2. DISTRIBUCIÓN HIPERGEOMÉTRICA: Como el muestreo sin reemplazo viola las condiciones de Bernoulli si la muestra no es grande, algunas veces es necesario plantear un tipo diferente de distribución. (Es evidente que la mayoría de muestreos se realiza sin reemplazo, esto implica que si la población es pequeña las probabilidades cambiarán en cada observación).
Cuando se selecciona sin reemplazo una muestra aleatoria de tamaño n de una población de tamaño N y el interés recae en la probabilidad de seleccionar x éxitos de los k artículos considerados como éxitos en la población, se realiza un experimento hipergeométrico y su función de probabilidad viene determinada por:
La distribución hipergeométrica requiere el conocimiento de k y N.
________________________________________
EJEMPLO 7.3.
En cierta empresa se fabricaron durante la semana 50 estaciones de juego para video. Cuarenta de ellas funcionaron perfectamente y las demás tenían algún defecto. Se seleccionó al azar una muestra de 5; ¿cuál es la probabilidad de que al menos 4 de ellas funcionaran perfectamente?
Solución:
P(X4) =
________________________________________
3. DISTRIBUCIÓN DE POISSON: Este es el modelo de probabilidad más adecuado para eventos que ocurren aleatoriamente a través del tiempo o el espacio. Este tipo de leyes se aplica a sucesos con probabilidad muy baja de ocurrir, obteniéndose como la distribución límite de una sucesión de variable binomiales.
Un tipo importante de problemas de decisión bajo incertidumbre es caracterizado por la pequeña probabilidad de ocurrencia de un acontecimiento particular, tal como un accidente. La función de probabilidad de Poisson calcula la probabilidad de exactamente x ocurrencias independientes durante un período de tiempo dado, si los eventos ocurren independientemente y a una tasa constante. La función de la probabilidad de Poisson también representa el número de ocurrencias sobre áreas o volúmenes constantes.
Esta distribución supone:
a) Independencia: El número de ocurrencias en un intervalo determinado es independiente del número de ocurrencias en cualquier otro intervalo.
b) La posibilidad de dos ocurrencias simultáneas puede ser asumida como cero.
c) El número promedio de ocurrencias por unidad de tiempo o espacio se considera una constante.
d) La probabilidad de que suceda determinado número de eventos en un proceso de Poisson depende únicamente de la longitud del intervalo observado y no de su ubicación.
La distribución de probabilidad de la variable aleatoria de Poisson X, que representa el número de resultados que ocurren en un intervalo de tiempo, área, espacio o volumen específico se denota así:
,
donde es el número promedio de resultados por unidad de tiempo o región y t es la longitud del intervalo.
...