Regresion Lineal Multiple
Enviado por • 25 de Noviembre de 2014 • 731 Palabras (3 Páginas) • 737 Visitas
TABLA DE CONTENIDO
LISTA DE TABLAS iii
LISTA DE GRAFICAS iv
ANTECEDENTES 1
OBJETIVO 2
METODOLOGIA 3
DESCRIPCION DE VARIABLES 8
BASE DE DATOS 8
ANALISIS DE REGRESION LINEAL MULTIPLE 9
RESULTADOS 11
MODELO PROPUESTO 11
ANALISIS EXPLORATORIO 11
GRAFICA MATRIZIAL DE DISPERSION 11
ANALISIS NUMERICO 12
MATRIZ DE CORRELACIONES 12
COEFICIENTE DE CORRELACION MULTIPLE AJUSTADO 12
COEFICIENTE DE DETERMINACION 12
COEFICIENTE DE DETERMINACION AJUSTADO 12
ANALISIS DE VARIANZA 12
PRUEBA DE SIGNIFICANCIA PARA LOS COEFICIENTES BETAS 13
CONCLUSIONES 14
SUGERENCIAS 15
REFERENCIAS 16
LISTA DE TABLAS
Tabla 1.- De Impuestos en Ciudades de España 5
Tabla 2.- Matriz de correlaciones 8
Tabla 3.- Coeficiente de determinación 8
Tabla 4.- Análisis de Varianza (ANOVA) 9
Tabla 5.- Coeficiente de regresión 9
LISTA DE GRAFICAS
Grafica 1.- Matrix PLot 7
ANTECEDENTES
En el país de España los problemas socio económicos en determinadas ciudades ha sido un problema de gran importancia por tal razón se recurrió a una encuesta en las diferentes ciudades según el Servicio de Administración Tributaria (SAT), los impuestos tienen un relación con el número de población, saldo familiar disponible, renta familiar disponible, renta per cápita.
OBJETIVO
Se busca establecer un modelo de regresión lineal múltiple
1.- El objetivo debe de ir redactado en infinitivo.
2.- El objetivo debe ser claro, conciso, preciso y corto
3.- El objetivo debe responder las siguientes preguntas:
¿quee se va a hcaer?
¿para que se va hacer
Como se va hacer
Cuando y donde
METODOLOGIA
BREVE DESCRIPCION DE LOS PASOS Y/O PRECEDIMIENTOS QUE SE VAN A SEGUIR PARA DAR CUMPLIMIENTO AL OBJETIVO.
DESCRIPCION DE VARIABLES
BASE DE DATOS
Numero de población Saldo Familiar Renta familiar disponible Renta per capita
1,657,924 26 86 96
32,466 7 29 71
8,970,535 24 61 120
528,947 20 67 77
234,578 8 45 80
9,382,458 5 9 89
274,918 17 43 107
15,374 9 37 81
35,486 3 17 65
945,386 35 71 102
8,362,549 24 5 86
374,635 45 67 54
63,524 9 12 32
84,848,563 12 15 78
48,369 23 54 91
28,547 43 67 123
44,895 12 34 231
647 5 78 23
3,675 45 23 321
26,956 34 56 234
8,476 12 246 65
83,696 34 25 98
824,396 76 67 12
762,587 89 43 9
37,355 35 24 32
36,486 67 98 76
36,596 123 45 98
2,547,697 45 36 34
2,548 567 8 65
539,835 35 26 45
7,243,850 78 17 26
143,745 25 14 28
158,028 75 75 19
10,254 67 47 15
7,341,936 2 87 7
14,537 8 35 27
15,378 4 15 28
92,545 65 68 9
32,797 9 10 26
983,515 11 57 108
32,849 10 425 167
123,456 4 11 47
64,328 25 3 75
82,531 78 56 17
86,436 45 36 487
32,749 24 76 4
15,374 75 34 85
17,957 49 67 46
123,567 50 6 26
23,489 24 9 16
Tabla 1.- De Impuestos en Ciudades de España
ANALISIS DE REGRESION LINEAL MULTIPLE
Para dos variables independientes, la fórmula general de la ecuación de regresión múltiple es: X 1 y X 2 son las variables independientes.
a es la intercepción en Y .b 1 es el cambio neto en Y por cada cambio unitario en X 1 , manteniendo X 2 constante. Se denomina coeficiente de regresión parcial, coeficiente de regresión neta o bien coeficiente de regresión. (Del Barrio Castro , 1992)
Análisis de regresión múltiple la ecuación general de regresión múltiple con k variables independientes es: el criterio de mínimos cuadrados se usa para el desarrollo de esta ecuación.
Como estimar b 1, b 2, etc. es muy tedioso, existen muchos programas de cómputo que pueden utilizarse para estimarlos.
Error estándar múltiple de la estimación
El error estándar múltiple de la estimación es la medida de la eficiencia de la ecuación de regresión. Está medida en las mismas unidades que la variable dependiente. Es difícil determinar cuál es un valor grande y cuál es uno pequeño para el error estándar. Error estándar múltiple de la estimación
La fórmula es:
Donde n es el número de observaciones y k es el número de variables independientes.
Regresión y correlación múltiples (suposiciones)
Las variables independientes y dependientes tienen una relación lineal.
La variable dependiente debe ser continua y al menos con escala de intervalo.
La variación en ( Y - Y ’) o residuo debe ser la misma para todos los valores de Y . Cuando éste es el caso, se dice que la diferencia presenta homosedasticidad .
Los residuos deben tener distribución normal con media igual a 0.
Las observaciones sucesivas de la variable dependiente no deben estar correlacionadas.
Tabla ANOVA
La tabla ANOVA proporciona la variación de la variable dependiente (tanto de la que está explicada por la ecuación de regresión como de la que no lo está).
Matriz de correlación
La matriz de correlación se usa para mostrar todos los posibles coeficientes de correlación simple entre todas las variables.
La matriz también se útil para localizar la correlación de las variables independientes. En la matriz se muestra qué tan fuerte está correlacionada la variable independiente con la variable dependiente.
Prueba global
La prueba global se usa para investigar si todas las variables independientes tienen coeficientes significativos. Las hipótesis son:
H a : al menos uno de los coeficientes de regresión no es cero.
Prueba global continuación
El estadístico de prueba es la distribución F con k (número de variables independientes) y n - (k + 1) grados de libertad, donde n es el tamaño de la muestra.
Prueba para variables individuales
La prueba se usa para determinar qué variable independiente tiene coeficientes de regresión diferentes de 0. Las variables que tiene coeficientes de regresión cero, suelen desaparecer del análisis. El estadístico de prueba es la distribución t con n - (k + 1) grados de libertad.
RESULTADOS
(INTRODUCCION)
MODELO PROPUESTO
Población= 446188-13231 (Saldo familiar disponible)-20066 (Renta familiar disponible)-846 (Renta per cápita)
ANALISIS EXPLORATORIO
GRAFICA MATRIZIAL DE DISPERSION
Grafica 1.- Matrix PLot
ANALISIS NUMERICO
MATRIZ DE CORRELACIONES
Variables Y X1 X2
X1 -0.075
X2 -0.1 -0.112
X3 -0.013 -0.04 0.097
Tabla 2.- Matriz de correlaciones
COEFICIENTE DE CORRELACION MULTIPLE AJUSTADO
COEFICIENTE DE DETERMINACION
Variables Y
x1 0.01
x2 0.01
x3 0.00
Tabla 3.- Coeficiente de determinación
COEFICIENTE DE DETERMINACION AJUSTADO
ANALISIS DE VARIANZA
Source DF Adj SS Adj MS F-Value P-Value P-Value
Regression 3 1.27E+14 4.23E+13 0.842
Saldo Familiar Disponible 1 5.46E+13 5.46E+13 0.36 0.554
Renta Familiar Disponible 1 8.45E+13 8.45E+13 0.55 0.462
Renta per capita 1 2.54E+11 2.54E+11 0 0.968
Error 46 7.05E+15 1.53E+14
Total 49 7.18E+15
Tabla 4.- Análisis de Varianza (ANOVA)
PRUEBA DE SIGNIFICANCIA PARA LOS COEFICIENTES BETAS
Term Coef P-Valor
Constant 4461888 0.138
X1 -13231 0.554
X2 -20066 0.462
X3 -846 0.968
Tabla 5.- Coeficiente de regresión
CONCLUSIONES
SUGERENCIAS
REFERENCIAS
...