Actividad Formular una regresión lineal, múltiple o polinomial
GuillauminTarea11 de Septiembre de 2021
2.491 Palabras (10 Páginas)472 Visitas
[pic 1]
[pic 2][pic 3][pic 4][pic 5][pic 6][pic 7][pic 8][pic 9]
Actividad 5. Proyecto integrador etapa 2
Formular una regresión lineal, múltiple o polinomial
Ejemplificar empleando ANOVA de un factor o dos factores
Realizar una investigación y análisis de estadística no paramétrica.
Introducción
[pic 10]
Esta actividad consiste en aplicar los conocimientos adquiridos a lo largo del curso y retomar lo aprendido en cada una de las actividades realizadas, lo que garantiza la transversalidad de los contenidos revisados para fortalecer el desarrollo de competencias y lograr el fin de formación planteado.
[pic 11][pic 12]
Objetivo
[pic 13]
El objetivo del Proyecto es encontrar datos provenientes de los procesos, ya sea académicos, empresariales o de algún otro sector de tal forma que se obtengan modelos de comportamiento a través de la regresión y/o la correlación de las variables involucradas. Seguidamente se puede ejemplificar mediante pruebas de ANOVA el comportamiento de los datos que previamente se han estudiado de manera particular, con el fin de generalizar el comportamiento del modelo obtenido. Finalmente se investigarán y analizarán otras formas de descripción de los datos utilizando estadística no paramétrica.
¿Qué hacer?
[pic 14]
- En la etapa anterior del proyecto realizaste una elección de variables inherentes a un proceso, para construir una ecuación o función que describe mediante el análisis de regresión y la correlación el comportamiento de los datos, además de observar las tendencias a partir de los gráficos de dispersión. En esta segunda etapa se te pide nuevamente seguir la estructura y desarrollar en equipo de tres personas los siguientes apartados:
- A partir de la revisión de los materiales sugeridos y actividades realizadas hasta el momento, sigue la siguiente estructura y desarrolla en equipo de tres personas los apartados que se indican para esta etapa de tu Proyecto integrador:
[pic 15]
Introducción.
En este trabajo se va a efectuar la recopilación de una serie de datos de un proceso para posteriormente efectuar los modelos de comportamiento a través de un análisis de regresión y/o correlación.
¿Qué es una dispersión?
La dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio.
El diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra.
En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo con la relación que exista entre ellas, definimos su tipo de correlación.
Con base en el comportamiento que toman las variables de estudio, podemos encontrar 3 tipos de correlación: Positiva, negativa y nula.
Correlación positiva: Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una relación proporcional.
Correlación negativa: Se presenta cuando una variable se comporta de forma contraria a la otra, es decir que, si una variable aumenta, la otra disminuye. Hay una relación inversa proporcional.
Correlación nula: Si no encuentras un comportamiento entre las variables, existe una correlación nula.
El coeficiente de correlación en un diagrama de dispersión.
El coeficiente de correlación nos describe cómo es la relación existente entre dos variables, en otras palabras, al conocer este número sabemos si la correlación es positiva o negativa y qué tan fuerte o débil es. Se usa la letra r para expresarla, veamos cómo:
- r=1
La correlación es positiva perfecta. Si una variable crece, la otra también lo hace en una proporción constante. Es una relación directa, por eso si trazamos una línea de ajuste esta va a pasar por todos y cada uno de los puntos.
- 0<r<1
Es cuando r esta entre 0 y 1 sin llegar a ser 0 y 1. Es una correlación positiva. El grado de cercanía de 1 define qué tan directa y proporcional es la relación entre ambas variables, por ende, entre más cerca esté de 0, más débil será su correlación negativa.
- r=0
La correlación es nula, es decir que no existe una relación lineal entre ambas variables. Qué tal si pruebas buscando otro tipo de relación.
- -1<r<0
Es cuando r esta entre -1 y 0 sin llegar a ser –1 y 0. Es una correlación negativa. El grado de cercanía a -1 define que tan inversa y proporcional es la relación
entre ambas variables, por ende, entre más cerca esté de 0, más débil será su correlación negativa.
r=-1
La correlación es negativa perfecta. Si una variable crece, la otra va a disminuir en proporción constante. Es una relación directa e inversa, por lo tanto, una línea de ajuste va a tocar todos los puntos graficados.
Resolución del problema
Se procede a hacer un análisis de una litográfica la cual va a montar un área de impresión de posters y se quiere saber mediante las pruebas y de esta forma determinar la cantidad de tinta por color a emplearse en la máquina que se va a usar.
Se ha decidido establecer la cantidad de errores que se tiene por impresión según el grado de llenado de los contenedores de tinta de la máquina.
Por lo consiguiente las variables a contemplar en el diagrama serán las siguientes:
- Cantidad de tinta en litros
- Cantidad de errores en la impresión
Se procede a la captura de variables quedando de la siguiente forma:
[pic 16]
Diagrama de dispersión[pic 17]
Matriz de correlación.
[pic 18]
Al hacer el análisis se puede observar que se tiene 0.93 y al observar el gráfico se puede ver que los puntos se encuentran sumamente cerca lo que indica un valor de correlación fuerte, por lo que se deduce que la entre un aumento en los litros de tinta influencia directamente en los errores de impresión.
Pruebas de significancia.
[pic 19]
Al hacer una revisión de las pruebas de significancia se puede deducir que se puede rechazar la prueba de hipótesis al ver que van de manera paralela el uso de tinta con el número de errores lo cual no diferencia mucho al verse en la gráfica
[pic 20]
4.2 Verificación de los supuestos del modelo: Normalidad, Varianza Constante e Independencia
Etapa 1 del Proyecto integrador
+
Etapa 2 del Proyecto integrador
III. ANOVA de un factor
- Identificación de factor (tiempo, factores físicos, ambientales, etc.) que afecta los datos
- Prueba de ANOVA de un factor a una muestra de los datos
- Verificación de los supuestos del modelo: Normalidad, Varianza Constante e Independencia
IV. ANOVA de dos factores
4.1 Prueba de ANOVA de dos factores para establecer la interacción de los factores (si los datos lo permiten)
[pic 21][pic 22]
ANOVA de un factor
- Identificación de factor (tiempo, factores físicos, ambientales, etc.) que afecta los datos
- Es necesario entender la independencia de la variable, por ejemplo, tiempo es independiente de posición.
- Los factores ambientales como posición, espacio, temperatura, número de visitantes, etc., afectan de manera importante al comportamiento de los datos.
- Prueba de ANOVA de un factor a una muestra de los datos
- Establecer el tamaño de la muestra de los datos.
- Realizar la muestra teniendo en cuenta la aleatoriedad, representatividad y la significancia de los datos.
- Realizar la prueba de ANOVA mediante el software Minitab y guardar los resultados, gráficas y diagramas que se obtengan.
- Verificación de los supuestos del modelo: Normalidad, Varianza Constante e Independencia
- Con los resultados obtenidos de la parte anterior, verificar la normalidad utilizando la prueba de Shapiro - Wilks, o cualquier otra prueba mediante Minitab
- Realizar la prueba de Varianza constante utilizando el método de Barlett para la homogeneidad de varianzas.
- Estudiar los residuos de las operaciones realizadas, mediante el método gráfico, con el fin de establecer la validez de la independencia del modelo y validar la prueba de ANOVA de un factor.
[pic 23]
- Prueba de ANOVA de un factor a una muestra de los datos
A5
ANOVA de un solo factor: Tiempo vs. Temperatura
Método
Hipótesis nula | Todas las medias son iguales |
Hipótesis alterna | No todas las medias son iguales |
Nivel de significancia | α = 0.05 |
Se presupuso igualdad de varianzas para el análisis.
Información del factor
Factor | Niveles | Valores |
Temperatura | 3 | a1, a2, a3 |
Análisis de Varianza
Fuente | GL | SC Ajust. | MC Ajust. | Valor F | Valor p |
Temperatura | 2 | 4.336 | 2.1682 | 9.08 | 0.000 |
Error | 57 | 13.613 | 0.2388 |
|
|
Total | 59 | 17.950 |
|
|
|
Resumen del modelo
S | R-cuad. | R-cuad. | R-cuad. |
0.488706 | 24.16% | 21.50% | 15.96% |
Medias
...