Naturaleza De La Econometria
ariadnazub23 de Noviembre de 2011
10.446 Palabras (42 Páginas)969 Visitas
Naturaleza de la econometría y de los datos económicos
¿Qué es la Econometría?
La Econometría se basa en métodos estadísticos para estimar las
relaciones económicas, poner a prueba teorías económicas y
evaluar y poner en práctica políticas gubernamentales y
comerciales.
Aplicación más común: predicciones de variables
macroeconómicas más importantes como las tasas de interés e
inflación y el producto interior bruto.
Diferencia entre la Econometría y la Estadística
La Econometría se concentra en el análisis de datos económicos no
experimentales o observables, que se distinguen de los
experimentales por estés se generaren en laboratorio.
Etapas del análisis económico empírico
Un análisis empírico usa datos para probar una teoría o estimar
una relación.
1. Se elabora un modelo económico formal, que consta de
ecuaciones matemáticas que describen diversas relaciones.
Ejemplo 1
Modelo económico de la delincuencia
Gary Becker postuló un modelo teórico de la maximización de la
utilidad para describir la participación de los individuos en
delincuencia.
Ciertos delitos tienen remuneraciones económicas claras pero
casi todos tienen costos también, como: los costos vinculados a
la posibilidad de ser atrapado y también, en caso de recibir el
veredicto de culpable, los costos de encarcelamiento.
( , , , , , , )
1 2 3 4 5 6 7
Y = f X X X X X X XEn la que
Y = horas dedicadas a las actividades delictivas
X1 = “sueldo” por hora de actividades delictivas
X2 = sueldo por hora en un empleo legal
X3 = otros ingresos, aparte de la delincuencia y el empleo
X4 = probabilidad de ser aprehendido
X5 = probabilidad de ser declarado culpable, si se es
Aprehendido
X6 = sentencia esperada, si se es hallado culpable
X7 = edad
2. Modelo Econométrico
delinc = β 0
+ β 1
suelm
+ β 2
ingr + β 3
frear + β 4
frecon + β 5
senprom + β 6
edad + u
En el que
delinc = una medida de frecuencia de las actividades delictivas
suelm = es el sueldo base que puede ganarse en un empleo legal
ingr = son los ingresos de otras fuentes
frear = es la frecuencia de arrestos por infracciones anteriores
frecon = es la frecuencia de condenas
senprom = es la duración promedia de las sentencias después de la
condena
El termino u se denomina perturbación o termino de error y
engloba todo el que explica delinc pero que no está incluido en el
modelo econométrico (porque no es observable).
Las constantes β’s son los parámetros del modelo econométrico y
describen las direcciones y la fuerza de las relaciones entre delinc y
los factores utilizados para determinar delinc en el modelo.
3. Reunir datos sobre las variables pertinentes 4. Estimar los parámetros del modelo, utilizando métodos
econométricos, y probar formalmente las hipótesis de interés.
5. Predicciones
Estructura de los datos económicos
Datos de corte transversal – Consta de una muestra de
individuos, hogares, empresas, ciudades, etc, tomada en un
momento de tiempo.
Normalmente, se supone muestreo aleatorio.
Los datos de corte transversal tienen mucho uso en economía como
por ejemplo en la microeconomía aplicada como la economía
laboral, la organización industrial, la economía urbana, etc.
Tabla
Obs Suel educ exper Sexo ecivil
1 3.10 11 2 1 0
2 3.24 12 22 1 1
3 3.00 11 2 0 0
4 6.00 8 44 0 1
5 5.30 12 7 0 1
. . . . . .
. . . . . .
. . . . . .
525 11.56 16 5 0 1
526 3.50 14 5 1 0 Datos de series de Tiempo – consta de observaciones, de uno o
más variables, hechas en el tiempo. Como ejemplos tenemos los
precios de las acciones, el IPC, el PIB, las cifras de ventas de
coches, etc.
En general estés datos son más difíciles de analizar que los datos
de corte transversal, porque las observaciones suelen ser
dependientes en el tiempo.
Tabla
obs año suelmin cob desem pib
1 1950 0.2 20.1 15.4 878.7
2 1951 0.21 20.7 16.0 925.0
3 1952 0.23 22.6 14.8 1015.9
. . . . . .
. . . . . .
. . . . . .
37 1986 3.35 58.1 18.9 4281.6
38 1987 3.95 58.2 16.8 4496.7
Datos de panel o longitudinales- un conjunto de datos de panel
consta de una serie temporal para cada miembro del corte
transversal en el conjunto de datos. Tabla
Obs ciudad Años homicidios población desem policía
1 1 1986 5 350000 8.7 440
2 1 1990 8 359200 7.2 471
3 2 1986 2 64300 5.4 75
4 2 1990 1 65100 5.5 75
. . . . . . .
. . . . . . .
. . . . . . .
297 149 1986 10 260700 9.6 286
298 149 1990 6 245000 9.8 334
299 150 1986 25 543000 4.3 520
300 150 1990 32 546200 5.2 493
Relaciones entre variables
Las técnicas de regresión permiten hacer predicciones sobre los valores de cierta variable Y (dependiente), a partir de los de otra X (independiente), entre las que se intuye
que existe una relación. Para ilustrarlo retomemos los ejemplos mencionados al principio
del tema anterior. Si sobre un grupo de personas observamos los valores que toman las
variables
X ≡ Altura medida en cm
Y ≡ Altura medida en metros
es trivial observar que la relación que hay entre ambas es: Y = X
100
.
Obtener esta relación es menos evidente cuando lo que medimos sobre el mismo grupo
de personas es, por ejemplo,
X ≡ Altura medida en cm
Y ≡ Peso en kilos
La razón es que no es cierto que conocida la altura xi de un individuo, podamos
determinar de modo exacto su peso yi
(dos personas que miden 1,70 m pueden tener
pesos de 60 y 65 kilos). Sin embargo, alguna relación entre ellas debe existir, pues parece
mucho más probable que un individuo de 2m pese más que otro que mida 1.20m. Es más,
nos puede parecer más o menos aproximado una relación entre ambas variables como la
siguiente
Y = X − 110 ± (error).
A la deducción, a partir de una serie de datos, de este tipo de relaciones entre variables, es lo que denominamos regresión.
1Mediante las técnicas de regresión de una variable Y sobre una variable X, buscamos
una función que sea una buena aproximación de una nube de puntos (xi
, yi
), mediante
una curva. Para ello hemos de asegurarnos de que la diferencia entre los valores yi
e yˆi
sea tan pequeña como sea posible.
El término que hemos denominado error debe ser tan pequeño como sea posible (ver
figura). El objetivo será buscar la función (también denominada modelo de regresión)
ˆY = f (X) que minimice dicho error.
2Bondad de un ajuste
Consideremos un conjunto de observaciones sobre n individuos de una población, en
los que se miden ciertas variables X e Y ,
X /→ x1, x2, . . . , xn
Y /→ y1, y2, . . . , yn
Estamos interesamos en hacer una regresión para determinar, de modo aproximado,
los valores de Y conocidos los de X. Así, debemos definir cierta variable
ˆY = f (X), que
debe tomar los valores
yˆ1 = f (x1) ,
yˆ2 = f (x2) ,
• • •
yˆn = f (xn) ,
3de modo que:
y1 − yˆ1 ≈ 0,
y2 − yˆ2 ≈ 0,
• • •
yn − yˆn ≈ 0,
Ello se puede expresar definiendo una nueva variable E = Y − ˆY que mida las diferencias
entre los auténticos valores de Y y los teóricos suministrados por la regresión,
e1 = y1 − yˆ1,
e2 = y2 − yˆ2,
• • •
en = yn − yˆn.
y calculando ˆY de modo que E tome valores cercanos a 0. Dicho de otro modo, E debe ser
una variable cuya media debe ser 0 y cuya varianza S
2
E debe ser pequeña (en comparación
con la de Y ).
Por ello, se define el coeficiente de determinación de la regresión de Y sobre X, R2
,
como
R
2
=
S
2
Y − S
2
E
S
2
Y
= 1 −
S
2
E
S
2
Y
.
Si el ajuste de Y mediante la curva de regresión ˆY = f (X) es bueno, cabe esperar que la
cantidad R2
tome un valor próximo a 1.
Análogamente, si nos interesa encontrar una curva de regresión para X como función
de Y , definiríamos
ˆX = f (Y ) y se procedería del mismo modo en las definiciones.
El valor de R2
sirve, entonces, para medir de qué modo las diferencias entre los verdaderos valores de una variable y los de su aproximación mediante una curva de regresión
son pequeñas en relación con los de la variabilidad de la variable que intentamos aproximar.
...