Coeficiente de Correlación. Estadistica
Dianasanchez12Trabajo15 de Mayo de 2021
2.731 Palabras (11 Páginas)326 Visitas
- ¿Qué es el coeficiente de correlación?
El coeficiente de correlación es la medida específica que cuantifica la intensidad de la relación lineal entre dos variables en un análisis de correlación. En los informes de correlación, este coeficiente se simboliza con la r.
Para dos variables, la fórmula compara la distancia de cada dato puntual respecto a la media de la variable y utiliza esta comparación para decirnos hasta qué punto la relación entre las variables se ajusta a una línea imaginaria trazada entre los datos. A esto nos referimos cuando decimos que la correlación examina las relaciones lineales.
- ¿Cómo se calcula el coeficiente de correlación?
Para calcular el coeficiente de correlación debemos realizar una serie de pasos y tener en cuenta lo siguiente:
- Si -1 < r < -0.7 Se determina que existe correlación negativa
- Si –0.7 < r < 0.7 Se determina que no existe correlación.
- Si 0.7 < r < 1 Se determina que existe correlación positiva.
- Primero debemos identificar los valores de ambas variables, ¨x¨ y ¨y¨.
x | y |
1 | 1,5 |
1.5 | 2 |
1.5 | 2.5 |
2 | 2.5 |
2 | 3 |
3 | 4 |
- En la tabla agregamos 3 nuevas columnas y llenamos con los cálculos que se indican en cada una, en la primera calculamos el cuadrado de los valores de ¨x¨, seguimos con el cuadrado de los valores de ¨y¨ y en la última se multiplica los valores de ambas variables.
x | y | x2 | y2 | xy |
1 | 1,5 | 1 | 2.25 | 1.5 |
1.5 | 2 | 2.25 | 4 | 3 |
1.5 | 2.5 | 2.25 | 6.25 | 3.75 |
2 | 2.5 | 4 | 6.25 | 5 |
2 | 3 | 4 | 9 | 6 |
3 | 4 | 9 | 16 | 12 |
- Determinamos el valor total de la suma de cada columna de la tabla:
x | y | x2 | y2 | xy |
1 | 1,5 | 1 | 2.25 | 1.5 |
1.5 | 2 | 2.25 | 4 | 3 |
1.5 | 2.5 | 2.25 | 6.25 | 3.75 |
2 | 2.5 | 4 | 6.25 | 5 |
2 | 3 | 4 | 9 | 6 |
3 | 4 | 9 | 16 | 12 |
11 | 15.5 | 22.5 | 43.8 | 31.3 |
- Aplicamos la formula correspondiente para resolver el coeficiente de correlación y sustituimos valores:
λ= [pic 2][pic 1]
2/n) (∑y2 – (∑y) 2/n [pic 4][pic 3]
Donde n es el número de datos y las sumatorias se refieren a todos los números.
λ= 31-(11.15.5)/6 = 0.96
[pic 5]
Como r está cerca del 1 se establece que existe una alta correlación positiva.
- Mencione la tabla de correlación lineal con cada uno de los ejemplos. Analice los valores.
Lo mencionaremos con el ejemplo a continuación:
Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a partir de la relación de éstas y la renta nacional. Para investigar la relación cuenta con los siguientes datos:
Disponemos los datos en la tabla:
[pic 6]
En este caso la X representa la renta nacional en millones de euros e Y representa las ventas de la compañía en miles de euros en el periodo que va desde 1990 hasta 2000.
Calcular:
a) La recta de regresión de Y sobre X.
b) El coeficiente de correlación lineal e interpretarlo.
c) Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la predicción para las ventas de la compañía en este año?
[pic 7]
[pic 8] [pic 9][pic 10]
[pic 11][pic 12]
[pic 13][pic 14]
[pic 15]
[pic 16]
Luego determinamos el coeficiente lineal de correlación y su interpretación, aplicando la formula correspondiente:
[pic 17]
Es un coeficiente de correlación positivo y cercano a uno, por lo que la correlación es directa y fuerte.
- ¿En qué consiste el coeficiente de Pearson, formula y pasos empleados para usarlo?
El coeficiente de correlación de Pearson es una prueba que mide la relación estadística entre dos variables continuas. Se define en estadística como la medida de la fuerza de la relación entre dos variables y su asociación con cada una de ellas. Si la asociación entre los elementos no es lineal, entonces el coeficiente no se encuentra representado adecuadamente.
Este coeficiente busca trazar una línea a través de los datos de dos variables para mostrar su relación, dicha relación puede ser positiva o negativa.
- Relación lineal positiva: En la mayoría de los casos, universalmente, los ingresos de una persona aumentan a medida que aumenta su edad.
- Relación lineal negativa: Si el vehículo aumenta su velocidad, el tiempo de viaje disminuye, y viceversa.
Para calcular el coeficiente de correlación de Pearson se deben seguir los siguientes pasos, los realizaremos con el siguiente ejemplo:
X | 18 | 17 | 15 | 16 | 14 | 12 | 9 | 15 | 16 | 14 | 16 | 18 |
Y | 13 | 15 | 14 | 13 | 9 | 10 | 8 | 13 | 12 | 13 | 10 | 8 |
- Paso 1: Debemos calcular la media aritmética para ¨x¨ y ¨y¨, aplicando la siguiente formula:
[pic 18]
Sumamos todos los valores de ¨x¨ y de ¨y¨:
Sx: 180
Sy: 138
Para x: [pic 19]= 180/ 12= 15
Para y: [pic 20]= 138/12= 11,5
- Paso 2: Realizamos y llenamos la tabla, incluyendo ambas variables. Etiqueta estas variables como “x” e “y”, siguiendo los cálculos que nos indica en cada columna. Añadimos tres columnas adicionales : (xy), (x2), y (y2)
[pic 21]
- Paso 3: Aplicamos la formula necesaria para ejecutar el coeficiente de correlación de Pearson:
[pic 22]
Aplicando la formula tenemos:
R= 28 = 0.416
[pic 23]
Si el resultado es negativo, hay una relación de correlación negativa entre las dos variables. Si el resultado es positivo, hay una relación de correlación positiva entre las variables. También se puede definir la fuerza de una relación lineal, es decir, una relación positiva fuerte, una relación negativa fuerte, una relación positiva media, etc.
...