Econometria I - Guia de la 1ra clase de laboratorio
JUAN CARLOS CCOPA PACHECOApuntes16 de Diciembre de 2025
578 Palabras (3 Páginas)10 Visitas
ECONOMETRÍA I
Markdown en Jupyter Notebook[pic 1]
[pic 2]
La varianza de “y” es igual a Y´ multiplicado por Mo multiplicado por Y
Donde Mo es la matriz hacedora de desvíos y esta matriz Mo es igual a Identidad – 1/n*i.i´
OBJETIVO DE LA CLASE:
- Habituarse con el software, aprender a programar (principal)
- Aprender a pasar los conceptos que estamos viendo, sobre todo los de algebra matricial a códigos, y que los apliquen con una data real de la ENAHO, y que hagamos algunos cálculos con esta variable.
- Entender cuales son las diferencias de ingresos y gastos que hay a nivel nacional entre departamentos
DESARROLLO DE LA CLASE
- Trabajar con el módulo 34 (sumaria) de la ENAHO, es donde el INEI condensa la información que tiene sobre todo en el módulo 100 (módulos globales)
- Descargamos el módulo 34 y vamos a aprender a filtrar la base de datos, nos vamos a quedar solo con Lima Metropolitana, nos vamos a quedar solo con algunas variables como gasto monetario, ingreso monetario y luego vamos a obtener la suma total de ingreso monetario + gasto monetario, así como su promedio usando estas fórmulas del formato Markdown, la fórmula de la suma y del promedio porque lo vamos a hacer de forma matricial
- Luego vamos a generalizar para todos los departamentos del Perú, es decir, haremos primero para Lima Metropolitana y luego vamos a usar un bucle para poder generalizar para todos los departamentos del Perú
NOTA: Se llama corte transversal o encuesta por ahora va a significar lo mismo
Paso 1: Dirigirme al módulo 34 de la ENAHO para el año 2024
Paso 2: Automatizar la descarga
Para ello se copia en la celda de la consola, el link del archivo en formato Stata del archivo sumaria de la siguiente manera:
[pic 3]
[pic 4]
Esto lo podríamos hacer con todos los módulos de la ENAHO
Paso 3: Necesito un conjunto de paquetes detrás para empezar a trabajar
Python trabaja con un conjunto de paquetes, iremos a la terminal virtual. La terminal de la computadora no la toco porque si la cierro ya cerré sesión.
[pic 5]
[pic 6]
Escribimos: py -m pip install pandas numpy wget
Paquetes:
- Pandas: Para trabajar con base de datos
- Numpy: Para trabajar con formulas
- Wget: “W” viene de web y “get” de obtener, es decir, consigue la información de la web
- Zipfile: Como estamos descargando un archivo comprimido, el paquete zipfile permita que se descomprima dicho archivo.
Nota: El paquete zipfile ya no debe instalarse porque ya viene instalada en las nuevas versiones de Python
Vamos a cargar una base de datos que tiene el formato de STATA, es decir, en formato .dta en Python.
Entonces con Pandas podemos cargar casi cualquier formato de base de datos, sea data estructurada o no estructurada.
Para el caso de Numpy, nos permitirá trabajar con matrices y con ciertas funciones (raíz cuadrada, exponencial, logarítmica, etc)
[pic 7]
[pic 8]
Una vez instalados los paquetes, volvemos a nuestro notebook.
Lo que vamos a hacer es llamar a las librerías con el proceso:
Import pandas as pd
Import numpy as np
Import wget
Import zipfile
Import os
Nota: OS me va a servir para trabajar con directorios
...