Modelo de datos panel
COTERA BERNUY PIERO ALESSANDRODocumentos de Investigación25 de Junio de 2023
1.924 Palabras (8 Páginas)93 Visitas
.
MODELO DE DATOS PANEL
Como dijimos anteriormente, en un conjunto de datos panel, se tienen observaciones de series temporales sobre una muestra de unidades individuales. Para una variable yit, se supone que se tiene i = 1, ..., N observaciones de corte transversal y t = 1, ..., T observaciones temporales, donde i y t hacen referencia a los individuos y al periodo de tiempo, respectivamente.
Atendiendo al n mero de observaciones que se disponen de cada individuo, se puede diferenciar entre panel balanceado (mismo n mero de observaciones para todos los individuos) y no balanceado (cuando hay algún individuo con distinto n mero de observaciones).
Además, dependiendo del n mero de observaciones de los cortes transversales y temporales, se podrá diferenciar entre los siguientes tipos de datos de panel:
Micropanel: si hay un reducido n mero de observaciones temporales para cada individuo y el n mero de individuos es muy elevado. Por lo tanto, para analizar las propiedades de los estimadores de los par metros en los modelos que se planteen con este tipo de datos, se considerar que N → ∞ y T es jo.[pic 1]
Macropanel: si hay un gran n mero de observaciones temporales y pocos in- dividuos. As , para analizar las propiedades que se planteen con este tipo de datos, se considerar que N es jo y T → ∞ .[pic 2]
Campo aleatorio: si se dispone de un elevado n mero de observaciones tempo- rales y de individuos. Por consiguiente, para analizar las propiedades que se planteen con este tipo de datos, se considerar que N → ∞ y T → ∞.[pic 3]
En nuestro caso, trabajaremos, tanto te ricamente como de manera practica con los modelos que se plantean para los datos de tipo micropanel.
El modelo m s sencillo de datos de panel es una extensión del modelo de regresión lineal clasico, formulado de la siguiente manera:
yit = xijtβ + εit; i = 1...N ; t = 1...T
donde xjit = (x1it, x2it, . . . , xkit) es el vector k×1 formado por las observaciones de los k regresores del individuo i en el periodo t, β 1es el vector de orden k×1 de par metros de inter s y εit la perturbación n aleatoria.
La característica m s sobresaliente de este modelo es que la observación n de cada variable tienen dos sub índices: i, para la dimensión n transversal, y t, para la dimen- si n temporal. En este caso, si las perturbaciones cumplen las hip tesis cl sicas, el[pic 4]
1 Sin p rdida de generalidad, se puede considerar que β incluye una ordenada en el origen o termino constante.
estimador por Mínimos de Cuadrados Ordinarios (MCO, también llamado estimador POOLED) ser ELIO (estimador lineal, insesgado y óptimo).
En numerosas ocasiones, existen características de los individuos que afectan a la variable end gena, que no recogen los regresores y que permanecen constantes a lo largo del tiempo para cada individuo, por ejemplo: la habilidad, la inteligencia o la cultura en el caso de que i esta referida a personas. Por tanto, resulta adecuado incorporar esta heterogeneidad individual que, generalmente, es inobservable en el modelo de la siguiente forma:
yit = xijtβ + ηi + εit i = 1...N ; t = 1...T
donde ηi es la heterogeneidad individual inobservable y constante a lo largo del tiempo para cada uno de los individuos. Esto di culta la estimación n del modelo ya que si ηi esta correlacionado con xit el estimador por MCO, en general, ser sesgado.
Un ejemplo de modelo de datos de panel es el trabajo planteado por Mundlak (1961) y recogido también en los trabajos de Chamberlain (1984) y Arellano (1991) donde se analiza la función de producción n Cobb-Douglas de un producto agrícola, en el que la heterogeneidad individual inobservable recoge la calidad del suelo. Además, en Arellano (1991) también n se muestran otros ejemplos de modelos de datos de panel. Por ejemplo: El análisis de la oferta de trabajo Inter temporal, donde la heterogeneidad individual inobservable esta relacionada con la función de utilidad marginal de la riqueza; el estudio sobre los rendimientos de la educación n, donde la heterogeneidad individual inobservable tiene que ver con la habilidad de cada individuo.
Como veremos posteriormente, trabajar con datos de panel sirve para controlar algunos efectos que in uyen en la variable end gena y que no son recogidos por las variables explicativas del modelo. De manera que, los modelos con datos de panel controlan la heterogeneidad individual inobservable, es decir, la existencia de efectos latentes no observables de cada agente encuestado, generalmente, constantes en el tiempo que inciden sobre el modo en que este toma sus decisiones. En el caso de que esos efectos latentes no se recojan explícitamente en el modelo, se producir un problema de variables omitidas, particularmente graves, cuando existe correlación n entre los efectos latentes y los regresores del modelo.
Otra de las ventajas que presentan los modelos con datos de panel es que proporcionan una mayor cantidad de información n, m s variabilidad, menos colinealidad entre variables y una mayor precisión. Por ultimo, los datos panel proporcionan una información n muy v lida de los individuos siguiéndolos a través del tiempo, lo que ofrece una visión m s completa del problema, interpretando mejor la din mica del cambio en unidades de corte transversal.
En contra, uno de los inconvenientes que aparecen al trabajar con datos de panel es que los individuos pueden abandonar la muestra, por lo que no es posible realizar su seguimiento a lo largo del tiempo. Además, pueden aparecer desequilibrios en la muestra, de manera que se tenga m s información n de algunos individuos que de otros, dando lugar a un panel no equilibrado o incompleto.
.
Caso real : EL modelo que vamos a plantear para estudiar la demanda de gasolina en la OCDE
Con el objetivo de obtener una visión m s amplia de este tipo de datos se va a proceder a analizar un caso practico sobre la demanda de gasolina en la OCDE desarrollado por Baltagi y Gri n. En este estudio el programa informático que se va utilizar es
E-views8 , en el Anexo se recoge de manera detallada la forma de analizar datos de panel en la versi n 8 de E-views.
EL modelo que vamos a plantear para estudiar la demanda de gasolina en la OCDE es:
ln (GAS/CAR)it = ηi+β1ln (Y/N )it+β2ln (Pmg/Pgdp)it+β3ln (CAR/N )it+β4ln (εit)
(13)
i = 1, . . . , 18; t = 1960, . . . , 1978.
donde
(GAS/CAR)= consumo de gasolina por coche;
(Y/N )= ingresos per c pita; (PMG/PGP )= precio de la gasolina; (CAR/N )= stock de coches per c pita;
En la tabla 5.1, se muestran los resultados de las estimaciones n por MCO de modelo para cada país. En general, la estimación n de los par metros de los distintos países proporciona resultados bastantes coherentes. Las elasticidades de la renta per c pita sobre la demanda de gasolina son positivas sobre la demanda de gasolina en todos los países, menos en Japón, España y Suecia que tiene un efecto negativo. Por el contrario, las elasticidades del precio de la gasolina son negativas sobre la demanda de esta. El incremento de coches per c pita genera una tendencia a reducir el uso del coche. A pesar de que la estimación n presenta resultados muy coherentes en signo y en valor, muchos de ellos no son significativos. Por ejemplo, en diez paises(Dinamarca, Grecia, Irlanda, Italia, Japón, Holanda, España, Suecia, Turquia, USA), la renta per c pita no tiene un efecto significativo y, en el caso del precio de la gasolina, son siete países en los que no es significativo. No parece lógico que muchas de ellas no sean significativas por lo que puede deberse a un problema de omisión de heterogeneidad individual inobservable. Por eso, dadas las características de los modelos de datos de panel, podemos mejorar estos resultados.
...