ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

DISTRIBUCIONES DE PROBABILIDAD CONTINUAS.

Fermin123424 de Septiembre de 2014

28.501 Palabras (115 Páginas)396 Visitas

Página 1 de 115

UNIDAD 1: DISTRIBUCIONES DE PROBABILIDAD CONTINUAS.

INTRODUCCION

EXISTE UN TUTORIAL INTERACTIVO Y COMPLEMENTARIO A LA INFORMACIÓN PRESENTADA EN ÉSTE DOCUMENTO EN LA SIGUIENTE DIRECCIÓN: http://www.uv.es/~lejarza/estadistic.htm

Las distribuciones de probabilidad continua mas utilizadas son:

La Uniforme,

la Normal,

la Gamma,

la Exponencial, y

la Chi-cuadrado 2

Medidas de Tendencia Central

Una característica importante de cualquier población es su posición, es decir, donde está situada con respecto al eje de abscisas (Eje horizontal). En nuestro caso, es importante saber si los datos se agrupan alrededor de 60 Kg. o de 90 Kg. o alrededor de 12 Kg. Una manera de obtener un dato numérico que nos dé idea de la posición de nuestra población es calcular el Promedio o Media de todas las observaciones:

Este importante parámetro nos permite efectuar comparaciones entre distintas poblaciones. Por ejemplo, si tuviéramos una población formada por mediciones del peso de mujeres de 30 años, otra de peso de varones de 40 años y una tercera de peso de niños de 8 años, es indudable que los promedios van a ser diferentes. El promedio, entonces, nos está diciendo que las tres poblaciones son diferentes y también en que medida difieren.

Ahora, si tuviéramos una población de varones con peso promedio 70 Kg. y otra población de varones con el mismo promedio, se puede afirmar que ambas poblaciones son equivalentes? Para responder esta pregunta necesitamos tener medidas de la dispersión de la población de datos.

Medidas de Dispersión

La otra característica muy importante de una población es el grado de dispersión de las observaciones. No es lo mismo si en nuestra población encontramos que todos los valores están entre 75 y 90 Kg. que si están entre 60 y 105 Kg., aunque el promedio sea el mismo. Si llegara a la tierra un marciano y le dijéramos que el peso promedio de los seres humanos adultos es de 70 Kg., puede llegar a creer que existen hombres de 350 Kg., o de 5 Kg.

Es necesario agregar alguna idea de la dispersión de los valores. Una manera es a través del Rango de las observaciones, es decir, el valor Máximo y el valor Mínimo de los datos de la población. Entonces, una descripción mas realista acerca de los seres humanos sería decir que pesan en promedio 70 Kg. y que el rango es de 40 a 120 Kg. (Estos valores son supuestos).

Una manera mas precisa de dar idea de la dispersión de valores de una población es a través de la Varianza o su raíz cuadrada, que es la Desviación Standard. Vamos a calcular la varianza y la desviación standard de un número pequeño de datos (Una muestra) para ilustrar el cálculo. Supongamos que se midió la altura de 10 personas adultas y de sexo femenino,

y se obtuvieron los valores siguientes:

165 cm.

163 cm.

171 cm.

156 cm.

162 cm.

159 cm.

162 cm.

168 cm.

159 cm.

167 cm.

El promedio de estas observaciones es:

Si a cada una de las observaciones le restamos el promedio, obtenemos los Residuos:

165 1,8

163 -0,2

171 7,8

156 -7,2

162 -1,2

159 -4,2

162 -1,2

168 4,8

159 -4,2

167 3,8

Los residuos también nos dan una idea de la dispersión de las observaciones individuales alrededor del promedio. Si el valor absoluto (El valor numérico sin el signo) de los residuos es grande, es porque los valores están muy dispersos. Si el valor absoluto de los residuos es pequeño, significa que las observaciones individuales están muy cerca del promedio, y por lo tanto, hay poca dispersión.

Pero nosotros necesitamos un sólo número que nos provea información acerca de la dispersión de los valores. Si sumamos los residuos, como algunos son positivos y otros negativos, se cancelarían entre sí, con lo cual perdemos la información acerca de la dispersión. Entonces, los elevamos al cuadrado:

165 1,8 3,24

163 -0,2 0,04

171 7,8 60,84

156 -7,2 51,84

162 -1,2 1,44

159 -4,2 17,64

162 -1,2 1,44

168 4,8 23,04

159 -4,2 17,64

167 3,8 14,44

Si ahora sumamos los residuos elevados al cuadrado, tenemos un número donde se condensa toda la información de la dispersión de la población:

Este número, la suma de cuadrados, es dependiente del número de datos N, y por lo tanto no nos sirve para comparar poblaciones con distinto número de observaciones.

Pero si dividimos la suma de cuadrados por N, tenemos un número que es independiente del número de observaciones, que se denomina Varianza:

En nuestro caso:

Las fórmulas anteriores son las que se aplican al cálculo de la varianza y desviación standard de una población de datos. Mas adelante veremos que las fórmulas a aplicar en el caso de una muestra son ligeramente diferentes. La varianza es un número que nos permite comparar poblaciones. Cuando la dispersión de las observaciones es grande (Datos que se alejan mucho por encima y por debajo del promedio), el valor de los residuos (distancia entre cada dato y el promedio) será grande. Entonces aumenta la suma de cuadrados de los residuos y por lo tanto la varianza.

También se utiliza la raíz cuadrada de la varianza:

Por lo tanto:

La desviación standard o desviación típica tiene las mismas unidades que la variable con la que estamos trabajando, en nuestro caso el centímetro. Tanto la varianza como la desviación standard nos permiten comparar el grado de dispersión de distintas poblaciones.

Media y Varianza de una Muestra

Hasta ahora hemos visto como se calcula la media o promedio de una población y también como se calcula la varianza y la desviación standard de una población o universo de observaciones. Cuando tenemos una muestra (Subconjunto de algunos datos extraídos de una población), también podemos calcular su media, su varianza y su desviación standard. Es muy importante distinguir entre la media, varianza y desviación standard poblacional, de la media, varianza y desviación standard muestral.

La media, varianza y desviación standard de una población o universo se denominan parámetros de la población y en general se designan con letras griegas: m para la Media, s2 para la Varianza y s para la Desviación Standard poblacionales. En el caso de una muestra, la media, varianza y desviación standard se denominan estadísticos y se utilizan letras de nuestro alfabeto:

para la Media

s2 para la Varianza

s para la Desviación Standard muestral

El cálculo de la varianza y la desviación standard de una muestra de n observaciones se realiza con una fórmula levemente diferente que la ya vista para la varianza y desviación standard de una población:

En lugar de dividir por n, el número total de observaciones en la muestra, dividimos por n - 1. Este valor, n - 1, son los Grados de Libertad de la muestra. En general, cuando tenemos una muestra de n observaciones, se dice que la misma tiene n - 1 grados de libertad.

La media, varianza y desviación standard de una muestra, en general, no van a coincidir con los mismos parámetros de la población de la cual se extrajo la muestra (Aunque usemos la misma fórmula para calcular la varianza muestral y poblacional). Si extraemos n muestras de una población, vamos a obtener n promedios muestrales distintos del promedio de la población y n varianzas muestrales distintas de la varianza de la población. Esto se debe a que una población o universo tienen un número muy grande de datos, mientras que una muestra son sólo algunos pocos datos extraídos de ese universo. Cuando sacamos una segunda, tercera, ... etc. muestras, los datos extraídos no tienen por que ser los mismos que en la primer muestra. Por lo tanto, el promedio y la varianza de las muestras van a ser distintos para las distintas muestras, y distintos de la media y la varianza de la población de la cual se extrajeron las muestras.

FUENTE: http://www.calidad.com.ar/controe3.html

TRATAMIENTO DE VARIABLES ALEATORIAS.

Variables aleatorias discretas.

Sean x1, x2, x3, ... xn los distintos valores que puede tomar la variable aleatoria.

Y p(x1), p(x2),... p(xn) su probabilidad.

Los pares de valores (xj, p(xj)) constituyen la distribución de probabilidades de la variable aleatoria.

p(x) se denomina función de probabilidad, y debe cumplir con las siguientes propiedades:

• 0 < p(xj) < 1 (p(x) es una probabilidad, y por lo tanto debe tomar valores entre 0 y 1).

•  p(xj) = 1 (la suma de probabilidades repartidas entre todos los valores de la variable debe ser igual a 1).

De la misma manera que calculamos frecuencias acumuladas, podemos acumular probabilidades, obteniendo la función de distribución de probabilidades:

F(x) =  p(xj)

Esta función representa la probabilidad de que la variable aleatoria sea menor o igual que un determinado valor:

F(xj) = P (X < xj)

Gráficamente, la función aumenta de "a saltos", ya que entre dos valores consecutivos de una variable discreta, no puede tomar valores intermedios.

...

Descargar como (para miembros actualizados) txt (171 Kb)
Leer 114 páginas más »
Disponible sólo en Clubensayos.com