ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Regresion y Correlacion Lineal

aler6821Ensayo17 de Mayo de 2020

3.859 Palabras (16 Páginas)537 Visitas

Página 1 de 16

GUIA: CORRELACION Y REGRESION LINEAL

Correlación: La correlación trata de establecer la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas. La correlación es una medida de la relación (covariación) lineal entre dos variables cuantitativas continuas (x, y).

Tipos de correlación: Para poder determinar los tipos de correlación entre dos variables es necesario construir en el plano cartesiano una gráfica de dispersión que mejor represente la relación entre la variable independiente y la variable dependiente.

1. Correlación directa

La correlación directa se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribución es una recta creciente.

[pic 1]

2. Correlación inversa

La correlación inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribución es una recta decreciente.

[pic 2]

3. Correlación nula

La correlación nula se da cuando no hay dependencia de ningún tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

[pic 3] 

Grado de correlación: El grado de correlación indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos:

1. Correlación fuerte

La correlación será fuerte cuanto más cerca estén los puntos de la recta.

[pic 4]

2. Correlación débil

La correlación será débil cuanto más separados estén los puntos de la recta.

[pic 5]

Covarianza: Para estudiar la relación lineal existente entre dos variables continuas es necesario disponer de parámetros que permitan cuantificar dicha relación. Uno de estos parámetros es la covarianza, que indica el grado de variación conjunta de dos variables aleatorias.

[pic 6]                [pic 7]

La covarianza depende de las escalas en que se miden las variables estudiadas, por lo tanto, no es comparable entre distintos pares de variables. El signo de la covarianza, por lo tanto, expresa la tendencia en la relación lineal entre las variables.

Coeficiente de Correlación de Pearson: Para poder hacer comparaciones se estandariza la covarianza, generando lo que se conoce como coeficiente de correlación.

[pic 8]

a. Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.

b. Si 0 < r < 1, existe una correlación positiva.

c. Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes, pueden existir todavía relaciones no lineales entre las dos variables.

d. Si -1 < r < 0, existe una correlación negativa.

e. Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

Regresión Lineal: Existen numerosas leyes físicas en las que se sabe de antemano que dos magnitudes x e y se relacionan a través de una ecuación lineal

[pic 9]

donde las constantes b (ordenada en el origen) y a (pendiente), dependen del tipo de sistema que se estudia y, a menudo, son los parámetros que se pretende encontrar.

Método de Mínimos Cuadrados: El método más efectivo para determinar los parámetros a y b se conoce como técnica de mínimos cuadrados.

De acuerdo al proceso se inicia calculado los coeficientes a y b, a través de las siguientes expresiones:

[pic 10][pic 11]

Teniendo los dos valores de los coeficientes se construye la ecuación esperada:

[pic 12]

Esta nueva ecuación ajusta los valores de la variable dependiente (y*), tomando como base los valores de la variable independiente (x) como validos en el estudio, dicho ajuste corresponderá en una gráfica de dispersión a la mejor aproximación de una línea recta.

A través de la ecuación esperada, se podrá realizar proyecciones para cualquiera de las dos variables involucradas. [pic 13]

Error Estándar de Estimación:  El error estándar de la media (es decir, el error debido a la estimación de la media poblacional a partir de las medias muestrales) es la desviación estándar de todas las posibles muestras (de un tamaño dado) escogidos de esa población. El error estándar de estimación mide la variabilidad o dispersión de los valores observados alrededor de la línea de regresión y se representa por:

[pic 14]


PRACTICA:

1. Supóngase que se está estudiando el efecto de cierta fricción constante y uniforme (en minutos) sobre láminas metálicas del mismo grosor (en mm) y de la misma aleación.  Se han efectuado 8 observaciones cuyos resultados son:

Grosor de la lámina:                3        5        6        8        9        10        12        15

Tiempo de Fricción:                 9,5        9,0         8,8         8,5         8,2         8,0         7,6         7,0

a.  Construir un diagrama de dispersión.

b.  Hallar e interpretar la covarianza.

c.  Obtener el coeficiente de correlación e interpretarlo.

d.  Determinar la ecuación esperada para la variable dependiente en función de la independiente.

e.  Encontrar el tiempo de fricción en minutos de una lámina cuyo grosor es de 9,3 m.m.

f.  Hallar el grosor de la lámina cuando la fricción constante y uniforme se aplicó durante 7,8 minutos.

g. Encontrar el error estándar de estimación e interpretarlo.

Solución:

[pic 15]

a.  Diagrama de Dispersión, para ello tenemos primero que decidir que la variable independiente corresponde al grosor de la lámina metálica mientras que la variable dependiente es el tiempo de fricción constante y uniforme:

[pic 16]

b.  Procedemos a calcular la covarianza con la sexta columna de la tabla y encontramos que:

[pic 17]

La variación entre el tiempo de fricción constante y uniforme, y el grosor de las láminas metálicas con respecto a sus medias es de -2.73, esto confirma que la relación entre las variables es negativa como lo demuestra el diagrama de dispersión.

c.  Hallamos el Coeficiente de Correlación de Pearson, con las cinco primeras columnas de la tabla:

[pic 18]

Afirmamos que el tiempo de fricción constante y uniforme de las láminas metálicas depende del grosor de las mismas, que la relación es negativa y muy fuerte.

d.  Procedemos a encontrar los valores de los coeficientes de la función esperada con los datos de las cinco primeras columnas de la tabla:

[pic 19]

Hallamos el valor de a:

[pic 20]

Hallamos el valor de b:

[pic 21]

Por tanto, la ecuación esperada será:

 [pic 22]

Teniendo esta ecuación, procedemos a calcular para cada caso los valores de , tomando la variable x como valores correctos, y llenamos la columna siete.[pic 23]

e. Si el grosor de la lámina metálica es de x= 9,3 mm, entonces el tiempo de fricción constante y uniforme será de:

...

Descargar como (para miembros actualizados) txt (18 Kb) pdf (469 Kb) docx (794 Kb)
Leer 15 páginas más »
Disponible sólo en Clubensayos.com