ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Correlación y Regresión Lineal


Enviado por   •  22 de Junio de 2021  •  Apuntes  •  1.829 Palabras (8 Páginas)  •  61 Visitas

Página 1 de 8

CORRELACIÓN Y REGRESIÓN LINEAL

En estadística la regresión lineal o ajuste lineal es un modelo matemático usado para aproximar la relación de dependencia entre una variable dependiente Y, la variable independiente X. En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre sí. El coeficiente de correlación lineal (r), mide el grado de intensidad de esta posible relación entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre las variables es lineal (es decir, si se representara en un gráfico, los pares de valores de las dos variables formarán la nube de puntos que se aproximarían a una recta).

[pic 1][pic 2]

Ejemplo de la dispersión en una regresión lineal con una variable dependiente (𝒚) y una variable independiente (𝒙).

Los valores que puede tomar el coeficiente de correlación "𝒓" son: −1 < 𝑟 < 1

Si "𝑟" > 0, la correlación lineal es positiva (si sube el valor de una variable sube el de la otra). La correlación es tanto más fuerte cuanto más se aproxime a 1.

Si "𝑟" < 0, la correlación lineal es negativa (si sube el valor de una variable disminuye el de la otra). La correlación negativa es tanto más fuerte cuanto más se aproxime a -1.

Si "𝑟" = 0, no existe correlación lineal entre las variables. Aunque podría existir otro tipo de correlación (parabólica, exponencial, etc.)

De todos modos, aunque el valor de "𝑟" fuera próximo a 1 𝑜 − 1, tampoco esto quiere decir obligatoriamente que existe una relación de causa-efecto entre las dos variables, ya que este resultado podría haberse debido al puro azar.

PROBLEMA:

En una preparatoria particular de Mérida, Yucatán se midieron y pesaron los 27 alumnos de primero grupo A , para saber si se puede suponer que la variable “Altura” influye sobre la variable “Peso” en el sentido de que pesos elevados vienen explicados por valores grandes de altura. Por el método de correlación y regresión lineal, verificar si hay una relación entre ambos datos.

[pic 3]

Tabla 1. Datos de altura y peso de 27 alumnos del grupo de primero A una preparatoria particular de Mérida, Yucatán para aplicar regresión lineal. Creación propia en Excel

[pic 4][pic 5]

Imagen 2. Gráfica la dispersión de los datos de altura y peso de 27 alumnos del grupo de primero A una preparatoria particular de Mérida, Yucatán para aplicar regresión lineal. Creación propia en Excel.

  1. Se calcula la media aritmética o promedio de las alturas en centímetros (x) y la media aritmética o promedio de los pesos en kilogramos (y)[pic 6]

𝒙̅ =


∑ 𝒙

=[pic 7]

𝒏


4440

=[pic 8]

27


𝒚̅ =


∑ 𝒚

[pic 9]

𝒏


1907

=        =[pic 10][pic 11]

27

  1. Se calcula la pendiente (Con los símbolos b o 𝖰𝟏)

∑ 𝒙𝒚 − 𝒏𝒙̅𝒚̅

𝒃 = ∑ 𝒙𝟐 − 𝒏(𝒙̅)𝟐 =[pic 12]


𝒏 ∑ 𝒙𝒊𝒚𝒊 − ∑ 𝒙𝒊 ∑ 𝒚𝒊

[pic 13]

𝒏 ∑ 𝒙𝟐 − (∑ 𝒙 )𝟐

𝒊        𝒊[pic 14]

(27)(319527) − (4440)(1907)        8627229 − 8467080[pic 15][pic 16]


160149

𝑏 =


(27)(733778) − (4440)2        = 19812006 − 19713600 =


=

98406[pic 17]

  1. Se calcula la ordenada de origen (Con los símbolos a o  𝖰𝟎)

𝒂 = 𝒚̅ − 𝒃𝒙̅ = 70.6296 − (1.627431)(164.444) =  −196.99166

  1. Se obtiene la ecuación de corrección para cada punto de la recta. (Esta ecuación es la que corrige los datos desfazados)

𝒚̂ = 𝒂 + 𝒃𝒙[pic 18]

  1. Se obtiene la varianza del error de estimación

𝒏(𝒚𝒊 − 𝒚̂𝒊)𝟐        ∑𝒏 𝒚𝟐 − 𝖰𝟎 ∑𝒏 𝒚𝒊 − 𝖰𝟏 ∑𝒏 𝒙𝒊𝒚𝒊        𝒏 𝒚𝟐 − 𝒂 ∑𝒏 𝒚𝒊 − 𝒃 ∑𝒏 𝒙𝒊𝒚𝒊

𝑺𝟐 =    𝟏        =    𝟏     𝒊        𝟏        𝟏        =    𝟏     𝒊        𝟏        𝟏        

𝒏 − 𝟐


𝒏 − 𝟐


𝒏 − 𝟐

Dónde: 𝛽0 es la ordenada al origen 𝛽1 es la pendiente

𝑆2 = 152051 − (−196.99166)(1907) − (1.627431)(319527) = 7705.9504 =[pic 19][pic 20][pic 21]

27 − 2        25

  1. Se obtiene el error estándar de estimación

[pic 22][pic 23]

𝑫. 𝑺. = √𝑽𝒂𝒓 = √308.23801 = 17.5567

La desviación estándar se basa en los cuadrados de las desviaciones respecto a la media, mientras que el error estándar de estimación se basa en los cuadrados de las desviaciones respecto a la línea de regresión. Si la suma de los cuadrados de las desviaciones es pequeña esto significa que la línea de regresión es representativa de los datos. Si los cuadrados son grandes, entonces la recta de regresión puede no representar a los datos.

...

Descargar como (para miembros actualizados)  txt (10.4 Kb)   pdf (254.7 Kb)   docx (655.7 Kb)  
Leer 7 páginas más »
Disponible sólo en Clubensayos.com