Guía de tarea estudio Econometria
july skzvoteMonografía5 de Agosto de 2023
1.885 Palabras (8 Páginas)66 Visitas
Universidad Nacional Jorge Basadre Grohmann
Facultad de Ciencias Jurídicas y Empresariales
[pic 1]Escuela Profesional de Ingeniería Comercial
GUÍA DE TAREA RSTUDIO
ECONOMETRIA
06-05434
Presentado por:
Ingrid Korayma Serrano Condori 2021-106058
Dr. Pedro Pablo Chambi Condori
30 de Julio de 2023
Caso de Aplicación Regresión Multiple
El análisis nos va permitir expresar la relación entre una variable de interés (la respuesta) y un conjunto de variables predictoras relacionadas. A continuación, se ejecutará la siguiente base de datos que contiene 1030 datos correspondiente:
- Y: Cement
- X1: Slag
- X2: Ash
- X3: Water
- X4: Coarseagg
- X5: Fineagg
- X5: Age
- X5: Strength
Base de Datos
[pic 2]
Se pide determinar lo siguiente:
- Obtenga el modelo que cumpla la condición de significancia estadística.
- Obtenga la matriz de correlación
- Haga la evaluación de homocedasticidad del caso
- Haga la evaluación de autocorrelación del caso
- Haga la evaluación de multicolinealidad
- Haga la formulación matricial del modelo de regresión.
Leyendo Archivos .csv
Los archivos .csv tienen las mismas ventajas que los archivos .txt sobre los archivos de Excel. Este tipo de archivos se pueden leer con la función read.csv ().
Una de las principales ventajas que brinda el uso de este tipo de archivos es que facilita el intercambio de datos en distintos programas.
En este caso el código será el siguiente para nuestro caso de ejemplo:
# leyendo el archivo .csv[pic 3]
#como resultado se obtiene el siguiente reporte:[pic 4]
# Luego para inspeccionar el tipo de dato que tiene la tabla:[pic 5]
str (BASE1)
#Se obtiene como resultado:
[pic 6]
Comando summary [pic 7]
summary (BASE1)
#como resultado se obtiene los datos descriptivos de la tabla:
[pic 8]
# Luego para poder visualizar la tabla de datos[pic 9]
view (BASE1)
fix (BASE1)
- Es importante tener en cuenta que la función “VIEW” se utiliza para visualizar un conjunto de datos en una ventana de visualización interactiva. Esta función es útil para explorar y examinar los datos de una manera más fácil y rápida. Al utilizar, se abre una nueva ventana en la que se muestra el conjunto de datos en forma de tabla, lo que permite ver todas las variables y observaciones de una manera clara y organizada.
- Por otro lado, la función “FIX” se utiliza para editar un conjunto de datos. Esta función es útil para corregir errores en los datos o para realizar cambios específicos en los datos.
# Como resultado debe aparecer así:
[pic 10]
[pic 11]
1. Obtenga el modelo que cumpla la condición de significancia estadística.
# Regresión: Se utilizo el siguiente comando [pic 12]
#Resultado[pic 13]
El modelo lineal esta expresado de la forma:
Y = 2300.7777-1.302(x1)-1.2106(x2)-2.5835(x3)-0.4860(x4)-0.7447(x5)-0.9327(x6)-0.1885(x7)+1.3625(x8)
Pero también podemos obtener el resumen de todo el proceso de regresión, haciendo:[pic 14]
S
Obteniendo como resultado:
[pic 15]
- Aplicación de remedio usando STEPWISE
El remedio Stepwise es una técnica utilizada en la regresión múltiple para seleccionar las variables independientes más relevantes para el modelo. Esta técnica se basa en la eliminación iterativa de variables que no contribuyen significativamente a la explicación de la variable dependiente (JoaquinAmatRodrigo, 2020).
Al observar los p-valor de las variables vemos que X2, X5 y X6 no cumplen con la condición de significancia.
#Para corregir el modelo se aplica la función STEPWISE de R
[pic 16]
Dando como resultado:[pic 17]
En este nuevo modelo no se eliminaron las variables, pero se eliminará SUPERPLASTIC (X4) , ya que su pvalor es mayor a 0.05 de significancia.
2.- Obtenga la matriz de correlación
[pic 18]
Obtenemos lo siguiente:[pic 19]
Para obtener el gráfico[pic 20]
# Como resultado se obtiene este gráfico:[pic 21]
- Cuando r = 0, significa que no hay una asociación lineal entre las variables. Sin embargo, puede haber una relación no lineal presente.
- Cuando r = 1, significa que hay una relación lineal positiva perfecta entre las variables. Todos los individuos muestreados se encuentran exactamente en la línea de mejor ajuste con una pendiente positiva.
- Cuando r = -1, significa que hay una relación lineal negativa perfecta entre las variables. Todos los individuos muestreados se encuentran exactamente en la línea de mejor ajuste con una pendiente negativa.
3. Haga la evaluación de homocedasticidad del caso
- Diagrama de dispersión
Es importante tener en cuenta que, el diagrama de dispersión es una herramienta gráfica útil para visualizar la relación entre dos variables. En R Studio, se puede crear un diagrama de dispersión utilizando la función plot() y personalizarlo según las necesidades del usuario. El diagrama de dispersión es una herramienta importante en la regresión lineal y puede ser utilizado en diferentes campos para explorar patrones y relaciones entre variables.
#Comando ggplot
[pic 22]
#Como resultado se obtiene este gráfico:
[pic 23]
- Prueba de homocedasticidad
La prueba de homocedasticidad en R Studio se utiliza para evaluar el supuesto de homocedasticidad, que es la suposición de que la varianza de los errores es constante en todos los niveles de las variables predictoras en un modelo de regresión lineal, determina si la varianza de los errores es constante o no en función de las variables predictoras
[pic 24]
- Se obtuvo el siguiente resultado:[pic 25]
Después de realizar la prueba de homocedasticidad, se pueden llegar a las siguientes
conclusiones:
- Es importante tener en cuenta que la interpretación de los resultados de la prueba de homocedasticidad puede variar dependiendo del contexto y los objetivos del análisis.
- Además, es recomendable realizar otras pruebas y análisis complementarios para respaldar las conclusiones obtenidas a partir de la prueba de homocedasticidad.
#Gráfico de los ajustes
[pic 26]
Resultados
[pic 27]
[pic 28]
- Prueba de White para el modelo
La prueba de White en R se utiliza para evaluar la presencia de heterocedasticidad en un modelo de regresión lineal, que es la suposición de que la varianza de los errores no es constante en todos los niveles de las variables predictoras, esta prueba de White es una prueba de heterocedasticidad robusta que no asume una distribución específica de los errores y es adecuada para modelos con errores no normales.
[pic 29]
Resultado del caso
...