Distribucion Normal De La Probabilidad
litosmel27 de Octubre de 2012
6.248 Palabras (25 Páginas)776 Visitas
Distribución normal de la probabilidad
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". La distribución de una variable normal está completamente determinada por dos parámetros, su media y su desviación estándar, denotadas generalmente por y .
En teoría de la probabilidad y estadística, la distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está definida sobre el conjunto de todos los eventos rango de valores de la variable aleatoria.
Cuando la variable aleatoria toma valores en el conjunto de los números reales, la distribución de probabilidad está completamente especificada por la función de distribución, cuyo valor en cada real x es la probabilidad de que la variable aleatoria sea menor o igual que x..
Por lo tanto una vez conocida la función de distribución F(x) para todos los valores de la variable aleatoria x conoceremos completamente la distribución de probabilidad de la variable.
Para realizar cálculos es más cómodo conocer la distribución de probabilidad, y sin embargo para ver una representación gráfica de la probabilidad es más práctico el uso de la función de densidad.
1. La curva tiene un solo pico, por consiguiente es unimodal. Presenta una forma de campana.
Características:
• La media de una población distribuida normalmente se encuentra en el centro de su curva normal.
• A causa de la simetría de la distribución normal de probabilidad, la mediana y la moda de la distribución también se hallan en el centro, por tanto en una curva normal, la media, la mediana y la moda poseen el mismo valor.
• Las dos colas (extremos) de una distribución normal de probabilidad se extienden de manera indefinida y nunca tocan el eje horizontal.
• Tiene una única moda, que coincide con su media y su mediana.
• La curva normal es asintótica al eje de abscisas. Por ello, cualquier valor entre y es teóricamente posible. El área total bajo la curva es, por tanto, igual a 1.
• Es simétrica con respecto a su media. Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.
• La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación típica. Cuanto mayor sea, más aplanada será la curva de la densidad.
• El área bajo la curva comprendido entre los valores situados aproximadamente a dos desviaciones estándar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo.
• La forma de la campana de Gauss depende de los parámetros y . La media indica la posición de la campana, de modo que para diferentes valores de la gráfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución.
Comentario: La distribución normal de la probabilidad es muy útil para determinar cuanto se ha alejado o acercado de la media el dato que estamos trabajando y saber a partir de la curva cuan probable es que nuestro llegue a ocurrir es parte importante para determinar si un determinado proyecto es factible o no.
Distribución normal estándar
La distribución normal estándar, o tipificada o reducida, es aquella que tiene por media el valor cero, μ = 0, y por desviación típica la unidad, σ =1.
Teniendo un conjunto de datos que se distribuyen en forma normal, con una media (M) y una desviación estándar (s) cualquiera, puede convertirse un dato X en dato z, mediante la expresión: Z = X - M / s, donde si: X es mayor que M, z es positivo, X = M, z = 0 y X es menor que M, z es negativo. Por ejemplo, si M = 70 y s = 10, la conversión de los valores 60, 70 y 80 en datos z sería:
z = 60 - 70 / 10 = -1
z = 70 - 70 / 10 = 0
z = 80 - 70 / 10 = 1
Nótese que la distancia entre la M y 80 es de una desviación estándar a la derecha de la media, que la distancia entre 60 y M también es de una desviación estándar pero por debajo de la media y que la distancia entre el valor 70 y M es igual a cero, por lo que el valor z que corresponde a un valor X mide la distancia que hay entre la media y el valor X, distancia que se mide en desviaciones estándar; en otras palabras, z indica el número de desviaciones estándar que hay entre un valor dado y la media (por arriba de la media si z es positivo y por abajo si z es negativo).
Cuando una distribución de frecuencias tiene una forma normal, el porcentaje de datos cuyos valores están comprendidos entre la media y un valor arriba de la media a una desviación estándar de distancia es de 34.13% aproximadamente. De manera simbólica: entre X y M + 2s se encuentra el 47.72% del total de datos y entre X y M + 3s se encuentra el 49.87% del total de datos.
Ejemplos:
a) Cuando M = 24 y s = 7, entre 24 y 31 se encuentra el 34.13%, ya que la distancia entre 24 y 31 es de una desviación estándar (z = 31 - 24 / 7 = 1) y
b) Cuando M = 100 y s = 25, entre 100 y 125 se encuentra el 34.13%, ya que la distancia entre 100 y 125 es de una desviación estándar (z = 125 - 100 / 25 = 1).
Cuando la distancia entre la media y un valor dado es de dos o tres desviaciones estándar, se presentan las siguientes situaciones: a) El porcentaje de datos es de 47.72% si los valores están comprendidos entre la media y un valor arriba de la media a dos desviaciones estándar de distancia y b) El porcentaje de datos es de 49.87% si los valores están comprendidos entre la media y un valor arriba de la media a una distancia de tres desviaciones estándar. Por ejemplo: siendo M = 30 y s = 8, el 47.72% de los datos se encuentran entre 30 y 46, porque la distancia entre estos valores es de dos desviaciones estándar (z = 46 - 30 / 8 = 2); en cambio, el 49.87% de los datos se ubican entre 30 y 54, ya que la distancia entre 30 y 54 es de tres desviaciones estándar (z = 54 - 30 / 8 = 3). En la Figura 2 se ilustra cómo se distribuyen estos porcentajes alrededor de M.
Comentario: Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana
Métodos y distribución de muestreo
Teoría elemental del muestreo
La teoría del muestreo es el estudio de las relaciones existente entre una población y muestras extraídas de la misma. Tiene gran interés en muchos aspectos de la estadística. Por ejemplo permite estimar cantidades desconocidas de la población (tales como la media poblacional, la varianza, etc.), frecuentemente llamada parámetros poblacionales o brevemente parámetros, a partir del conocimiento, de las correspondientes cantidades muestrales (tales como la media muestral, la varianza , etc.), a ,menudo llamadas estadísticos muestrales o brevemente estadísticos.
La teoría de muestreo es también útil para determinar si la diferencias que se puedan observar entre dos muestras son debidas a la aleatoriedad de las mismas o si por el contrario son solamente significativas. Tales preguntas surgen por ejemplo, al ensayar un nuevo suero para el tratamiento de una enfermedad, o al decir si un proceso de producción es mejor que otro. Estas decisiones envuelven a los llamados ensayos e hipótesis de significación, que son de gran importancia en la teoría de la decisión.
En general, un estudio de inferencias, realizados sobre una población mediante muestras extraídas de la misma, junto con las indicaciones de la exactitud de tales inferencias aplicadas a la teoría de la probabilidad, se le conoce como inferencia estadística.
Definiciones
1- Población: Es aquel conjunto de individuos o elementos que podemos observar, medir una característica o atributo.
Ejemplos de población:
* El conjunto de todos los estudiantes de una Universidad.
* El conjunto de personas fumadoras de una región.
2- Muestreo: Se refiere al procedimiento empleado para obtener una o más muestras de una población. Este se realiza una vez que se ha establecido un marco muestral representativo de la población, luego se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.
Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no necesariamente son iguales, lo más probable es que varíen de una muestra a otra.
3- Estadístico: Son los datos o medidas que se obtienen sobre una muestra y por
...