Foro 1 del tema 3 de la materia Proyecto de campo.
Enviado por Wasp6107 • 26 de Marzo de 2016 • Tarea • 1.650 Palabras (7 Páginas) • 1.912 Visitas
Título del trabajo: ANÁLISIS DE CORRELACIÓN Y REGRESIÓN LINEAL. y modelos estadísticos
FORO 1 DEL TEMA 2
ALUMNO: Jaime Ignacio Ávila Macías
Matrícula: 2729093
Curso: Desarrollo de proyecto de campo
Profesora: Martha Jiménez Zambrano.
Módulo: 1 Tema: 2
Fecha: viernes, 18 de marzo de 2016
Bibliografía:
Douglas, M. (2004). Guía del participante para Green Belt de Sigma Pro. Estados Unidos: Sigma Pro Inc.
Título: Análisis de correlación y regresión lineal
Instrucciones:
Contesta las siguientes preguntas:
Existen 2 métodos principales para calcular la capacidad de un producto, proceso o servicio. ¿Cuáles son dichos métodos?
La metodología de: variables discretas y la de variables continuas.
¿Cuál es la diferencia entre los índices Cp y Cpk en comparación con los índices Pp y Ppk?
Cp y Cpk son índices de capacidad a corto plazo y los Pp y Ppk son índices de capacidad a largo plazo.
¿Qué podemos hacer con datos no normales cuando intentamos estimar la capacidad?
Si los datos no son normales se debe usar la rutina capacidad no normal, que puede ser usada para resolver diversas distribuciones no normales. Por lo tanto, es extremadamente útil al resolver datos complejos.
Si fracasa con la rutina no normal, entonces se debe usar la rutina Box Cox para tratar de transformar los datos no normales a datos normales.
La transformación Box Cox es la menos recomendada debido a que cambia la forma de los datos incluyendo el área de la cola.
¿Bajo qué circunstancias querrías usar regresión lineal?
Se utiliza para resolver variables de respuesta continuas contra variables independientes continuas.
¿Cuáles son las 4 suposiciones que se deben hacer cuando se realiza una regresión lineal y cómo se revisa cada suposición?
Suposiciones de regresión lineal
- La media de los componentes del error es cero, esto implica que: E(y)= b0 + b1x
- La varianza de los componentes del error es constante para todos los valores de x, esto implica que la varianza es una constante, que normalmente se indica con s2.
- Los componentes del error son observaciones distribuidas aleatoriamente de una distribución normal con media cero y varianza s2.
- Los errores asociados con cualquiera de las dos observaciones no están relacionados o son independientes.
¿Qué nos dice la tabla ANOVA en una regresión?
Nos da las fuentes de variación que pueden ser: por la recta, residual o global; con base a la suma de cuadrados, grados de libertad y varianzas.
Ref.: 6.6 Tabla ANOVA. El contraste de regresión, en la página web http://www.udc.es/dep/mate/estadistica2/sec6_6.html, consultada el día 15 de marzo de 2016.
¿Qué prueba es usada para saber si un coeficiente es significativo o no?
La gráfica de Línea ajustada no permite saber por medio del análisis de la varianza del modelo global es útil y si los coeficientes son significativos.
¿Cuál es la diferencia entre los intervalos de confianza y el intervalo de predicción en una gráfica de línea ajustada (fitted line plot)?
Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor de un parámetro de población desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras de una población en particular generen intervalos de confianza idénticos.
Un intervalo de predicción es un intervalo elaborado con una serie de datos de las muestras de modo que contenga observaciones futuras.
Ahora lleva a cabo los siguientes ejercicios:
[pic 1] Ejercicio 1
Abre el archivo [pic 2] OperatorResponseTime2.MTW.
Supón que los datos del archivo representan tiempos de respuesta seleccionados de forma aleatoria para tres operadores en un centro de atención telefónica.
La organización tiene un límite superior de 45 minutos por llamada, calcula la capacidad del operador.
Piensa con detenimiento cómo se estimará la capacidad.
Primero se realizará la prueba de cada operador para conocer si los datos son normales o no, obteniendo lo siguiente:
Los operadores 1 y 3 muestran valores inferiores a p < 0.05 y solo el operador 2 muestra valor superior a P < 0.05; por lo que se concluye que los datos no son normales.
[pic 3]
[pic 4]
[pic 5]
Ahora se realiza el informe de capacidad del proceso por operador, se consideró el valor límite inferior de 30 minutos por llamada y de 45 el límite superior.
[pic 6]
[pic 7]
[pic 8]
[pic 9]
De las gráficas anteriores se puede observar como resultados un Ppk de 0.53 en el operador No. 2 que muestra un proceso incapaz de cumplir con los requerimientos del cliente, los operadores 1 y 3 son aún más bajos, 0.16 y 0.20, respectivamente. Se concluye que el proceso no es capaz de cumplir los requerimientos solicitados.
Ejercicio 2
Abre el archivo [pic 10] Correlation Exercise 1.MTW.
Supón que desean determinar qué etapa (en un proceso de 6 etapas) tiene mayor poder de predicción (relación lineal) con el tiempo total de ciclo del proceso.
Analizan los datos que se muestran en la parte inferior para determinar cuál es la etapa del proceso que tiene mayor influencia con respecto al tiempo total de ciclo del proceso.
Construye y prueba un modelo de regresión lineal simple para los tiempos de ciclo para cada una de las seis etapas contra el total del tiempo de ciclo.
...