Regreción lineal multiplo y Logistica
José de J Pérez HTrabajo4 de Abril de 2023
888 Palabras (4 Páginas)161 Visitas
PEP II M. MULTIVARIANTES
Pregunta 1:
Se pretenden estimar los gastos en alimentación de una familia en base a la información que proporcionan las variables regresoras 'ingresos mensuales y 'número de miembros de la familia'. Para ello se recoge una muestra aleatoria simple de 15 familias, cuyos resultados se facilitan en la tabla adjunta. (El gasto e ingreso se expresan en cien mil euros).
Gasto Alimentación | Ingresos | Tamaño |
0,43 | 2,10 | 3 |
0,31 | 1,10 | 4 |
0,32 | 0,90 | 5 |
0,46 | 1,60 | 4 |
1,25 | 6,20 | 4 |
0,44 | 2,30 | 3 |
0,52 | 1,80 | 6 |
0,29 | 1,00 | 5 |
1,29 | 8,90 | 3 |
0,35 | 2,40 | 2 |
0,35 | 1,20 | 4 |
0,78 | 4,70 | 3 |
0,43 | 3,50 | 2 |
0,47 | 2,90 | 3 |
0,38 | 1,40 | 4 |
¿Es posible encontrar un modelo adecuado para predecir los gastos en alimentación? Desarrolle y critique.
Explorando la relación entre las variables, mediante el empleo de los diagramas de dispersión:
Variable dependiente:
Y: Gastos de alimentación
Regresoras:
X1: Ingresos mensuales
X2: Número de miembros de la familia (Tamaño)
[pic 1]
Gráfica 1
[pic 2]
Gráfica 2
[pic 3]
Gráfica 3
[pic 4]
Gráfica 4
De las graficas anteriores parece existir relación entre el gasto de alimentación y las variables X1, X22 y X1X2:
Modelo: [pic 5]
Así se tiene:
Gasto Alimentación (Y) | Ingresos (X1) | X22 | X1∙X2 |
0,43 | 2,1 | 9 | 6,3 |
0,31 | 1,1 | 16 | 4,4 |
0,32 | 0,9 | 25 | 4,5 |
0,46 | 1,6 | 16 | 6,4 |
1,25 | 6,2 | 16 | 24,8 |
0,44 | 2,3 | 9 | 6,9 |
0,52 | 1,8 | 36 | 10,8 |
0,29 | 1 | 25 | 5 |
1,29 | 8,9 | 9 | 26,7 |
0,35 | 2,4 | 4 | 4,8 |
0,35 | 1,2 | 16 | 4,8 |
0,78 | 4,7 | 9 | 14,1 |
0,43 | 3,5 | 4 | 7 |
0,47 | 2,9 | 9 | 8,7 |
0,38 | 1,4 | 16 | 5,6 |
[pic 6]
[pic 7]
[pic 8]
[pic 9]
[pic 10]
[pic 11]
Modelo:
[pic 12]
[pic 13]
[pic 14]
[pic 15]
[pic 16]
[pic 17]
Probando si el modelo es significativo al nivel de significancia del 5%.
[pic 18]
[pic 19]
Como p-valor es menor que 0,05, se rechaza la hipótesis nula, por lo que el modelo es significativo.
Tabla ANOVA
Fuente | g.l. | SC | CM | Fobs | P-valor | |
Regresión | 3 | 1,42313314 | 0,47437771 | 613,405259 | 1,6074E-12 | |
Residuos | 11 | 0,00850686 | 0,00077335 |
|
| |
Total | 14 | 1,43164 |
|
|
|
Se observa que el coeficiente de determinación es:
[pic 20]
[pic 21]
Por tanto, el modelo explica en un 99,41% los gastos alimenticios. Puesto que el valor es cercano a 1, se puede afirmar que el modelo tiene una buena predicción de los gastos alimenticios.
Pregunta 2:
Un banco desea analizar la posibilidad de que nuevos clientes presenten atraso en el pago de sus cuotas al solicitar un crédito de consumo, en ese contexto, se tiene la información de 10 clientes que solicitaron un crédito de consumo, donde se mide la edad del cliente (X), su sueldo mensual en millones de pesos (Y), el valor del préstamo solicitado (Z) y si presenta atrasó en el pago de las cuotas (W: donde 0 indica no atraso y 1 indica si atraso).
La información se presenta a continuación:
X | 25 | 39 | 53 | 46 | 34 | 32 | 28 | 33 | 27 | 36 |
Y | 2,1 | 6,8 | 4,5 | 2,2 | 4,1 | 5,2 | 4,9 | 5,2 | 5,8 | 5,6 |
Z | 1,8 | 3 | 3,5 | 2 | 1 | 3,5 | 5 | 1,5 | 10 | 5,5 |
W | 1 | 0 | 0 | 1 | 0 | 1 | 1 | 0 | 0 | 1 |
Con esta información se pide generar un modelo de regresión logística que permita clasificar a las y los clientes según su atrasó o no en el pago del préstamo, donde se deben responder las siguientes preguntas:
- ¿Cuál es el valor de los parámetros calculados?
- ¿Cuál es el modelo regresión logística?
- Si se presentan 5 posibles clientes
X | Y | Z |
30 | 2,2 | 2,2 |
45 | 4,5 | 1 |
26 | 5,6 | 2 |
30 | 7 | 3,5 |
33 | 2,1 | 4 |
¿A cuál(es) de ellos si debieran aceptar la obtención del crédito de consumo?
- Por software:
[pic 22]
b)
[pic 23]
...