Métodos estadisticos aplicados a la ingeniería ejercicio 3
andres henriquezEnsayo29 de Septiembre de 2023
1.163 Palabras (5 Páginas)65 Visitas
EIN6017 – METODOS ESTADISTICOS APLICADOS A LA INGENIERÍA EJERCICIO 3
EIN6017 – METODOS ESTADISTICOS APLCIADOS A LA INGENIERIA
EJERCICIO 3
[pic 1]
MATIAS JALET CASTRO MOLINA 18.791.620-8
LUIS FERNANDO SILVA ORTIZ 13703405-0
NRC 7947
[pic 2]
En primer lugar para poder realizar un análisis anova de un factor con multiples mediciones independientes se debe modificar la base de datos:
Método | Tiempo |
MetodoI | 15 |
MetodoI | 16 |
MetodoI | 14 |
MetodoI | 15 |
MetodoI | 17 |
MetodoII | 14 |
MetodoII | 13 |
MetodoII | 15 |
MetodoII | 16 |
MetodoII | 14 |
MetodoIII | 13 |
MetodoIII | 12 |
MetodoIII | 11 |
MetodoIII | 14 |
MetodoIII | 11 |
Una vez creada la nueva base de datos se realiza el análisis anova con las variables método y tiempo para determinar si los distintitos métodos de entrenamiento generan resultados distintos.
[pic 3]
De acuerdo a los resultados entregados por la tabla anova se tiene:
Que el F valor es 16,04 con una significancia de P=0,0015.
De estos se puede realizar el siguiente test de hipótesis:
[pic 4]
[pic 5]
Dado lo anterior según lo arrojado por la tabla anova el valor de F tiene una significancia p menor a 0,05, por lo tanto se rechaza la hipótesis nula. Es decir existe una diferencia en términos de los tiempos promedio en la carrera de acuerdo al método de entrenamiento.
RESUMEN | ||||||
Grupos | Cuenta | Suma | Promedio | Varianza | ||
MetodoI | 5 | 77 | 15,4 | 1,3 | ||
MetodoII | 5 | 72 | 14,4 | 1,3 | ||
MetodoIII | 5 | 61 | 12,2 | 1,7 | ||
ANÁLISIS DE VARIANZA | ||||||
Origen de las variaciones | Suma de cuadrados | Grados de libertad | Promedio de los cuadrados | F | Probabilidad | Valor crítico para F |
Entre grupos | 26,8 | 2 | 13,4 | 9,34883721 | 0,003568245 | 3,885293835 |
Dentro de los grupos | 17,2 | 12 | 1,43333333 | |||
Total | 44 | 14 |
|
|
|
|
Corroborando con Excel aplicando análisis Anova de 1 factor se tiene
El valor de F es mayor que el valor de F crítico, y pvalor es menor a 0,05, por ende se rechaza la hipótesis nula, es decir si hay diferencias en los tiempos de carrera en relación al método de entrenamiento escogido.
[pic 6]
[pic 7]
[pic 8]
[pic 9]
- Al ajustar los datos a un modelo de regresión logística se tiene los siguientes valores dados por la función glm de Rstudio.
Variable | Parámetro | Valor |
Intercepto | B0 | -18,18458 |
Estado Civil | B1 | -3,08737 |
Puntaje PTEST | B2 | 0,0415 |
Luego la ecuación de regresión logística que modela el fenómeno es:
[pic 10]
De esto se tiene la siguiente interpretación: El valor de B0 indica las probabilidades de ser contratado cuando la persona presenta un estado civil 0 (casado) y cuando no ha rendido el test (Puntaje PTEST 0). Es decir las posibilidades de sr contratados disminuyen en 18,2 de ser contratados. Si el estado civil es soltero las posibilidades de ser contratados disminuyen en 3,1. En términos del puntaje de PTEST a medida que aumenta el puntaje las posibilidades de ser contratado aumentan en 0,04.
- Calidad del modelo
En primer lugar de acuerdo a los estadísticos entregados por la regresión lineal en Rstudio, los parámetros del modelo tienen valores de significancia menores a p=0,05, excepto por la variable estado civil, sin embargo el software califica la variable como significativa.
Aplicando un test chicuadrado se puede comprobar que efectivamente las variables tienen significancia.
[pic 11][pic 12]
En términos de predicción aplicando una matriz de confusión y graficando los resultados se tiene:
[pic 13]
La siguiente Tabla se resume en la tabla de doble entrada Oservaciones/predicciones
Predicciones | Total | ||
Observaciones | 0 | 1 | |
0 | 16 | 4 | 20 |
1 | 2 | 28 | 30 |
De la tabla se puede extraer que el modelo predice una contratación cuando se observa una contratación en 28 de 30 casos. Y en caso contrario predice una no contraccion cuando se observa una no contratacion en 16 de 20 casos.
Luego la capacidad predictiva del modelo :
[pic 14]
Luego el modelo es capaz de predecir el 88% de los casos.
Lo anterior se presenta en un modelo de mosaico, en rojo se muestran los casos donde el modelo falla.
[pic 15]
- Probabilidad de no ser contratada Y=0 si se tienen PTEST=690 y X=1:
La probabilidad se puede calcular como:
[pic 16]
[pic 17]
[pic 18]
[pic 19]
La probabilidad de no ser contratada siendo soltera con un puntaje de 690 es 0,18%
[pic 20]
Resultados del modelo en R:
- Dispersión con línea de regresión
[pic 21]
Coeficiente de correlación
Coeficiente de correlación= 0,96 lo que indica una correlación positiva fuerte entre las variables.
[pic 22]
- Modelo de regresión Lineal
[pic 23]
[pic 24]
De acuerdo a los valores entregados por el modelo se resumen los coeficientes en la siguiente tabla:
Parámetro | Variable | Valor |
Intercepto | a | -26,131 |
Flujo de tránsito | B1 | 37,294 |
De acuerdo a lo anterior el modelo que explica el fenómeno del contenido de plomo en la corteza de los árboles (variable dependiente) se resume:
...