ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Intervalos De Confianza, Pruebas De Hipótesis, Regresión Y Análisis De Varianza

ALEXISTHH25 de Abril de 2014

10.922 Palabras (44 Páginas)882 Visitas

Página 1 de 44

UNIVERSIDAD DE ORIENTE

NÚCLEO BOLÍVAR

ESCUELA CIENCIAS DE LA TIERRA

CATEDRA: Estadística

SECCION: 01

Intervalos de confianza,

Pruebas de hipótesis,

Regresión y

Análisis de varianza

Presentado a: Elaborado por:

Prof. Luis Araya Garrido Jesús. C.I.24.891.887

Maita Alexis. C.I. 22.800.592

CIUDAD BOLÍVAR, Marzo DEL 2013

Introducción.

Cuando se utiliza la inferencia para estimar un parámetro poblacional debemos decir cómo de buena es esa inferencia, o sea debemos dar una medida de su bondad. Para ello será necesario conocer la diferencia existente entre la estimación del parámetro poblacional, calculada a partir de una muestra específica de tamaño n, y el valor verdadero del parámetro poblacional

En este informe el problema más sencillo que se puede presentar es el de detectar la influencia de un factor que tiene dos niveles en una variable de interés (diseño de experimentos con un factor a dos niveles). Este problema es exactamente el mismo que el problema de comparar las medias de dos poblaciones. Problema que bajo la hipótesis de normalidad de las poblaciones se resuelve por el contraste de la t. La generalización de este problema es contrastar la igualdad de las medias de los I niveles de un factor, esto es, estudiar la influencia de un factor con I niveles en la variable de interés.

Para resolver este problema se utiliza la técnica del Análisis de la Varianza: ADEVA (en inglés, ANalysis Of VAriance: ANOVA) introducida por R. A. Fisher en los años treinta. El análisis de la varianza es la herramienta fundamental para el estudio de una variable de interés a partir de observaciones que dependen de varios factores.

El ANOVA es la herramienta básica para el análisis de los modelos estadísticos de Diseño de Experimentos y Regresión Lineal, porque permite descomponer la variabilidad de un experimento en componentes independientes que pueden asignarse a diferentes causas.

Índice.

Introducción……………….……………………………….…………………………1

1.- Intervalos de confianza………………………………………………………...2

2. Pruebas de hipótesis…….……………………………..………………………..22

3. Regresión……………………..………………………………………………..……52

4. Análisis de varianza………………………………………………………….…...65

Conclusiones……………...….……………………….……………………….….….68

Bibliografía…………………...….………………………………….………………..70

1) Intervalos de Confianza

Conceptos previos:

Distribución normal se usa para muestras grandes y la distribucion T de student para muestras pequeñas, la forma más fácil de explicar la diferencia de la normal y la T de student es por formula,

La fórmula de una distribución normal estándar es,

Z=(E(x)-x)/Std(x)

y la de la T de student es,

T=(E(x)-x)/(Std(x)/Sqrt(n))

Donde E(x) es el valor esperado de x. (o el prómedio)

Std(x) es la desviación estandard de x.

Sqrt(n) es la raíz cuadrada del número de observaciones.

“Nota: tomando en consideración estas definiciones en el trabajo que se desarrolla a continuación habrán ejemplos representados por la distribución t-students o la distribución normal dependiendo cual sea el caso”.

Estimación Puntual

La inferencia estadística está casi siempre concentrada en obtener algún tipo de conclusión acerca de uno o más parámetros (características poblacionales). Para hacerlo, se requiere que un investigador obtenga datos muéstrales de cada una de las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los valores calculados de varias cantidades muéstrales. Por ejemplo, representamos con (parámetro) el verdadero promedio de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. Podría tomarse una muestra aleatoria de 10 conexiones para determinar la resistencia a la ruptura de cada una, y la media muestral de la resistencia a la ruptura se podía emplear para sacar una conclusión acerca del valor de . De forma similar, si es la varianza de la distribución de resistencia a la ruptura, el valor de la varianza muestral s2 se podría utilizar para inferir algo acerca de .

Cuando se analizan conceptos generales y métodos de inferencia es conveniente tener un símbolo genérico para el parámetro de interés. Se utilizará la letra griega para este propósito. El objetivo de la estimación puntual es seleccionar sólo un número, basados en datos de la muestra, que represente el valor más razonable de .

Una muestra aleatoria de 3 baterías para calculadora podría presentar duraciones observadas en horas de x1=5.0, x2=6.4 y x3=5.9. El valor calculado de la duración media muestral es = 5.77, y es razonable considerar 5.77 como el valor más adecuado de .

Una estimación puntual de un parámetro es un sólo número que se puede considerar como el valor más razonable de . La estimación puntual se obtiene al seleccionar una estadística apropiada y calcular su valor a partir de datos de la muestra dada. La estadística seleccionada se llama estimador puntual de .

El símbolo (theta sombrero) suele utilizarse para representar el estimador de y la estimación puntual resultante de una muestra dada. Entonces se lee como "el estimador puntual de es la media muestral ". El enunciado "la estimación puntual de es 5.77" se puede escribir en forma abreviada .

Ejemplo:

En el futuro habrá cada vez más interés en desarrollar aleaciones de Mg de bajo costo, para varios procesos de fundición. En consecuencia, es importante contar con métodos prácticos para determinar varias propiedades mecánicas de esas aleaciones. Examine la siguiente muestra de mediciones del módulo de elasticidad obtenidos de un proceso de fundición a presión:

44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1

Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la varianza poblacional . Un estimador natural es la varianza muestral:

En el mejor de los casos, se encontrará un estimado para el cual siempre. Sin embargo, es una función de las Xi muestrales, por lo que en sí misma una variable aleatoria.

+ error de estimación

Entonces el estimador preciso sería uno que produzca sólo pequeñas diferencias de estimación, de modo que los valores estimados se acerquen al valor verdadero.

Estimación por Intervalos

Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información alguna sobre la precisión y confiabilidad de la estimación. Por ejemplo, imagine que se usa el estadístico para calcular un estimado puntual de la resistencia real a la ruptura de toallas de papel de cierta marca, y suponga que = 9322.7. Debido a la variabilidad de la muestra, nunca se tendrá el caso de que = . El estimado puntual nada dice sobre lo cercano que esta de . Una alternativa para reportar un solo valor del parámetro que se esté estimando es calcular e informar todo un intervalo de valores factibles, un estimado de intervalo o intervalo de confianza (IC). Un intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza, que es una medida de el grado de fiabilidad en el intervalo. Un intervalo de confianza con un nivel de confianza de 95% de la resistencia real promedio a la ruptura podría tener un límite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un nivel de confianza de 95%, es posible tener cualquier valor de entre 9162.5 y 9482.9. Un nivel de confianza de 95% implica que 95% de todas las muestras daría lugar a un intervalo que incluye o cualquier otro parámetro que se esté estimando, y sólo 5% de las muestras producirá un intervalo erróneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se estima está dentro del intervalo.

Una interpretación correcta de la "confianza de 95%" radica en la interpretación frecuente de probabilidad a largo plazo: decir que un evento A tiene una probabilidad de 0.95, es decir que si el experimento donde A está definido re realiza una y otra vez, a largo plazo A ocurrirá 95% de las veces. Para este caso

el 95% de los intervalos de confianza calculados contendrán a .

Esta es una construcción repetida de intervalos de confianza de 95% y se puede observar que de los 11 intervalos calculados sólo el tercero y el último no contienen el valor de .

De acuerdo con esta interpretación, el nivel de confianza de 95% no es tanto un enunciado sobre cualquier intervalo en particular, más bien se refiere a lo que sucedería si se tuvieran que construir un gran número de intervalos

...

Descargar como (para miembros actualizados) txt (69 Kb)
Leer 43 páginas más »
Disponible sólo en Clubensayos.com