ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Distribuciones De Probabilidades Y Muestrales

7 de Junio de 2014

3.092 Palabras (13 Páginas)2.060 Visitas

Página 1 de 13

Distribuciones de Probabilidad y Muéstrales

6.2-Distribución binomial (n,p)

La distribución binomial es una distribución discreta muy importante que surge en muchas aplicaciones bioestadísticas. Fue obtenida por Jakob Bernoulli (1654-1705) y publicada en su obra póstuma Ars Conjectandi en 1713. Esta distribución aparece de forma natural al realizar repeticiones independientes de un experimento que tenga respuesta binaria, generalmente clasificada como “éxito” o “fracaso”; este experimento recibe el nombre de experimento de Bernoulli. Ejemplos de respuesta binaria pueden ser el hábito de fumar (sí/no), si un paciente hospitalizado desarrolla o no una infección, o si un artículo de un lote es o no defectuoso. La variable discreta que cuenta el número de éxitos en n pruebas independientes de ese experimento, cada una de ellas con la misma probabilidad de “éxito” igual a p, sigue una distribución binomial de parámetros n y p, que se denota por (Bi(n,p)). Este modelo se aplica a poblaciones finitas de las que se toman elementos al azar con reemplazo, y también a poblaciones conceptualmente infinitas, como por ejemplo las piezas que produce una máquina, siempre que el proceso de producción sea estable (la proporción de piezas defectuosas se mantiene constante a largo plazo) y sin memoria (el resultado de cada pieza no depende de las anteriores). Un ejemplo de variable binomial puede ser el número de pacientes con cáncer de pulmón ingresados en una unidad hospitalaria.

Un caso particular se tiene cuando n=1, que da lugar a la distribución de Bernoulli.

En Epidat 4.0 el número de pruebas de la distribución binomial está limitado a 1.000; para valores superiores no es posible realizar el cálculo. Esta restricción no debe ser considerada un inconveniente dado que, cuando se tiene un número de pruebas “grande”, la distribución binomial se aproxima a una distribución normal de media np y varianza np(1-p).

Valores: k: 0, 1, 2, ..., n

Parámetros:

n: número de pruebas, n ≥ 1 entero

p: probabilidad de éxito, 0 < p < 1

Ejemplo

En un examen formado por 20 preguntas, cada una de las cuales se responde declarando “verdadero” o “falso”, el alumno sabe que, históricamente, en el 75% de los casos la respuesta correcta es “verdadero” y decide responder al examen tirando dos monedas: pone “falso” si ambas monedas muestran una cara y “verdadero” si al menos hay una cruz. Se desea saber cuál es la probabilidad de que tenga más de 14 aciertos. Hay que proporcionarle a Epidat 4.0 los parámetros de la distribución binomial y el punto k a partir del cual se calculará la probabilidad. En este caso n = 20, p = 0,75 y el punto k = 14.

Resultados con Epidat 4.0: 6.3-Distribución hipergeométrica (N,R,n)

La distribución hipergeométrica suele aparecer en procesos muéstrales sin reemplazo, en los que se investiga la presencia o ausencia de cierta característica. Piénsese, por ejemplo, en un procedimiento de control de calidad en una empresa farmacéutica, durante el cual se extraen muestras de las cápsulas fabricadas y se someten a análisis para determinar su composición.

Durante las pruebas, las cápsulas son destruidas y no pueden ser devueltas al lote del que provienen. En esta situación, la variable que cuenta el número de cápsulas que no cumplen los criterios de calidad establecidos sigue una distribución hipergeométrica. Por tanto, esta distribución es la equivalente a la binomial, pero cuando el muestreo se hace sin reemplazo, de forma que la probabilidad de éxito no permanece constante a lo largo de la n pruebas, a diferencia de la distribución binomial.

Esta distribución se puede ilustrar del modo siguiente: se tiene una población finita con N elementos, de los cuales R tienen una determinada característica que se llama “éxito” (diabetes, obesidad, hábito de fumar, etc.). El número de “éxitos” en una muestra aleatoria de tamaño n, extraída sin reemplazo de la población, es una variable aleatoria con distribución hipergeométrica de parámetros N, R y n.

Cuando el tamaño de la población es grande, los muestreos con y sin reemplazo son equivalentes, por lo que la distribución hipergeométrica se aproxima en tal caso a la binomial.

En el caso de esta distribución, Epidat 4.0 limita el cálculo a valores del tamaño de población (N) menores o iguales que 1.000.

Valores:

k: Max{0,n-(N-R)}, ..., min{R,n}, donde max{0,n-(N-R)} indica el valor máximo entre 0 y n-

(N-R) y min{R,n} indica el valor mínimo entre R y n.

Parámetros:

N: tamaño de la población, N ≥ 1 entero

R: número de éxitos en la población; 1 ≤ R ≤ N, N entero

n: número de pruebas; 1 ≤ n ≤ N, n entero Ejemplo

Se sabe que el 7% de los útiles quirúrgicos en un lote de 100 no cumplen ciertas especificaciones de calidad. Tomada una muestra al azar de 10 unidades sin reemplazo, interesa conocer la probabilidad de que no más de dos sean defectuosas.

El número de útiles defectuosos en el lote es R = 0,07100 = 7. Para un tamaño muestral de

n= 10, la probabilidad buscada es P{número de defectuosos  2}.

La probabilidad de que, a lo sumo, haya dos útiles defectuosos en el lote es aproximadamente 0,98. Además, puede decirse que la media y la varianza de la distribución hipergeométrica (100, 7, 10) son 0,7 y 0,59, respectivamente; en este caso, la media de útiles quirúrgicos defectuosos en 10 pruebas es de 0,7 y la varianza de 0,59. 6.4-Distribución Poisson ()

La distribución de Poisson debe su nombre al matemático francés Simeón Denis Poisson (1781-1840), aunque ya había sido introducida en 1718 por Abraham De Moivre (1667-1754) como una forma límite de la distribución binomial que surge cuando se observa un evento raro después de un número grande de repeticiones [12]. En general, la distribución de Poisson de parámetro  se puede utilizar como una aproximación de la binomial, Bin(n, p), si el número de pruebas n es grande, pero la probabilidad de éxito p es pequeña, siendo  = np; podemos considerar que la aproximación Poisson-binomial es “buena” si n  20 y p  0,05 y “muy buena” si n  100 y p  0,01.

La distribución de Poisson también surge cuando un evento o suceso “raro” ocurre aleatoriamente en el espacio o el tiempo. La variable asociada es el número de ocurrencias del evento en un intervalo o espacio continuo, por tanto, es una variable aleatoria discreta que toma valores enteros de 0 en adelante (0, 1, 2,...). Así, el número de pacientes que llegan a un consultorio en un lapso dado, el número de llamadas que recibe un servicio de atención a urgencias durante 1 hora, el número de células anormales en una superficie histológica o el número de glóbulos blancos en un milímetro cúbico de sangre son ejemplos de variables que siguen una distribución de Poisson. En general, es una distribución muy utilizada en diversas áreas de la investigación médica y, en particular, en epidemiología.

El concepto de evento “raro” o poco frecuente debe ser entendido en el sentido de que la probabilidad de observar k eventos decrece rápidamente a medida que k aumenta.

Supóngase, por ejemplo, que el número de reacciones adversas tras la administración de un fármaco sigue una distribución de Poisson de media  = 2. Si se administra este fármaco a 1.000 individuos, la probabilidad de que se produzca una reacción adversa (k = 1) es 0,27; los valores de dicha probabilidad para k = 2, 3, 4, 5, 6 reacciones, respectivamente, son: 0,27; 0,18; 0,09; 0,03 y 0,01. Para k = 10 o mayor, la probabilidad es virtualmente 0. El rápido descenso de la probabilidad de que se produzcan k reacciones adversas a medida que k aumenta puede observarse claramente en el gráfico de la función de masa de probabilidad obtenido con Epidat 4.0:

Para que una variable recuento siga una distribución de Poisson deben cumplirse varias condiciones:

1. En un intervalo muy pequeño (p. e. de un milisegundo) la probabilidad de que ocurra un evento es proporcional al tamaño del intervalo.

2. La probabilidad de que ocurran dos o más eventos en un intervalo muy pequeño es tan reducida que, a efectos prácticos, se puede considerar nula.

3. El número de ocurrencias en un intervalo pequeño no depende de lo que ocurra en cualquier otro intervalo pequeño que no se solape con aquél.

Estas propiedades pueden resumirse en que el proceso que genera una distribución de Poisson es estable (produce, a largo plazo, un número medio de sucesos constante por unidad de observación) y no tiene memoria (conocer el número de sucesos en un intervalo no ayuda a predecir el número de sucesos en el siguiente).

El parámetro de la distribución, , representa el número promedio de eventos esperados por unidad de tiempo o de espacio, por lo que también se suele hablar de  como “la tasa de ocurrencia” del fenómeno que se observa. La distribución de Poisson tiene iguales la media y la varianza. Si la variación de los casos observados en una población excede a la variación esperada por la Poisson, se está ante la presencia de un problema conocido como sobredispersión y, en tal caso, la distribución binomial negativa es más adecuada.

Para valores de  mayores de 20 la distribución de Poisson se aproxima a una distribución normal de media y varianza iguales a . Por este motivo no se debe considerar una limitación la restricción que tiene Epidat 4.0 de no realizar el cálculo para valores de  superiores a 50.

Valores:

k:

...

Descargar como (para miembros actualizados) txt (19 Kb)
Leer 12 páginas más »
Disponible sólo en Clubensayos.com