Análisis Econometría - Empleo EEUU
Alex GarayInforme23 de Noviembre de 2016
3.773 Palabras (16 Páginas)315 Visitas
Trabajo práctico:
[pic 2]
¿Cuáles son los determinantes del empleo y del desempleo?
Nombres: Cassandra Doña
Alex Moreno
Felipe Vidal
Fecha: 21/11/2016
Introducción
La situación en el país de América del norte: Estados Unidos, ha sido conocida dentro del mundo laboral como uno de los lugares con mayor discriminación de todo tipo al momento de contratar trabajadores. Pero queremos saber si este tipo de características sociales o culturales de la población estadounidense influyen de alguna forma en el mercado laboral de ese país. La intención de este análisis es saber cómo afectan ciertas condiciones al nivel de empleabilidad en Estados Unidos y, al mismo tiempo, conocer los determinantes del desempleo para Estados Unidos todo en tan sólo un modelo.
Para ello se usarán los métodos vistos en econometría para calcular los coeficientes pertenecientes a cada una de las variables que podrían afectar a la investigación, ya sea el color de piel, género sexual, edad, zona de procedencia, sueldo promedio o nivel de estudios. La pregunta a responder es, ¿Cuáles son los determinantes del empleo y del desempleo? Para hacerlo, se deben aplicar los datos obtenidos y el MCO debe ser así:
- Employed =B0 + B1earnwke + B2race + B3age + B4married + B5union + B6ne_states + B7so_states + B8ce_states + B9we_states + B10government + B11private + B12self + B13educ_lths + B14educ_hs + B15educ_aa + B16educ_bac + B17educ_adv + B18female + u
Detalle de las variables del MCO
A continuación presentamos las variables que usaremos en nuestro modelo inicial. Donde cada una de las variables significan lo siguiente:
- Employed: Variable dummy que es igual a 1 si el individuo fue contratado en abril del año 2007 en EE.UU. y será 0 de no ser contratado en ese mes, esta será nuestra variable de interés dicótoma.
- Earnwke: Son las ganancias promedio que un individuo obtiene a la semana.
- Age: Variable continua. Se refiere a la edad de un individuo.
- Race: Variable dummy en que si el individuo es de raza blanca será igual a 1, será 2 cuando sea de raza negra y será 3 cuando no sea ni de raza blanca ni raza negra.
- Female: Variable dummy que si la persona es una mujer el valor será igual a 1, si no lo es el valor es cero.
- Married: Variable dummy, será 1 si el individuo está casado, si no lo está entonces el valor es cero.
- Union: Variable dummy que será 1 si la persona convive con alguien y cero si no lo hace.
- ne_states: Variable dicótoma que será igual a 1 si el individuo proviene de un estado noreste de EE.UU.
- so_states: Variable dicótoma que será igual a 1 si el individuo proviene de un estado sureste de EE.UU.
- ce_states: Variable dicótoma que será igual a 1 si el individuo proviene de un estado central de EE.UU.
- we_states: Variable dicótoma que será igual a 1 si el individuo proviene de un estado oeste de EE.UU.
- government: Variable dicótoma que será igual a 1 si está trabajando para el gobierno
- Private: Variable dicótoma que será igual a 1 si está trabajando para
- Self: Variable dicótoma que será igual a 1 si está trabajando para
- educ_lths: Variable dummy que será igual a 1 si el nivel más alto de educación es menor que un graduado de escuela secundaria.
- educ_hs: Variable dummy que será igual a 1 si el nivel más alto de la educación es un graduado de la escuela secundaria.
- educ_somecol: Variable dummy que será igual a 1 si el nivel más alto de educación es menor que un graduado de alguna universidad.
- educ_aa: Variable dummy que será igual a 1 si el nivel más alto de educación es de Licenciatura grado AA.
- educ_bac: Variable dummy que será igual a 1 si el nivel más alto de educación es de Licenciatura grado BA o BS.
- educ_adv: Variable dummy que será igual a 1 si el nivel más alto de educación es de Licenciatura grado Avanzada.
- u: Todos los factores que no estamos considerando en el modelo.
*Nota: No ocuparemos la variable Unemployed debido a que nosotros queremos saber los determinantes del empleo y desempleo, por ende, no podemos tener 2 variables dicotómicas en nuestro modelo y no es necesario hacer dos modelos para explicar el problema, pues nos basta con solo un modelo.
A partir de este modelo queremos demostrar nuestra hipótesis de trabajo, la cual es que el coeficiente de empleabilidad “employed” es estadísticamente distinto de cero, y queremos comprobar si la muestra en este estudio apoya o no nuestra teoría. Para esto verificaremos primero si nuestro modelo cumple con los supuestos de MRL (Modelo de regresión lineal), luego estimamos nuestro modelo a través MCO (Mínimos cuadrados ordinarios) a través del programa Stata con la función “reg employed earnwke race age married union ne_states so_states ce_states we_states government private self educ_lths educ_hs educ_somecol educ_aa educ_bac educ_adv female”, e interpretaremos los coeficientes, para ver el efecto que estos poseen en nuestra variable explicada.
Y realizamos las pruebas diagnósticas, para ver si es probable que se cumpla el supuesto de la Homocedasticidad para este modelo a través del contraste de hipótesis Breusch-Pagan para esto utilizamos el comando predict u, residuals para guardar los residuos del modelo calculado anteriormente, después para generar una nueva variable de los residuos al cuadrado usamos gen usq=u^2, la cual con ella hacemos las regresiones de la variable explicada con respecto a las variables explicativas a través de “reg employed earnwke race age married union ne_states so_states ce_states we_states government private self educ_lths educ_hs educ_somecol educ_aa educ_bac educ_adv female” obteniendo posiblemente nuevos resultados que nos ayudarán a determinar si la varianza de los errores son heterocedásticos, en el caso de que nuestro modelo no se cumpla el supuesto de homocedasticidad, lo corregiremos utilizando el comando robust.
Entonces, se puede comenzar a realizar una regresión para saber cuáles son los determinantes del empleo en Estados Unidos. Una vez que se conozcamos, evaluemos y ocupemos los datos útiles a usar en el estudio.
Datos
La fuente utilizada para hacer nuestro trabajo fueron los datos recopilados desde EE.UU. en el mes de abril del año 2007 tomando elementos como el salario semanal de los trabajadores, edad, raza, género, estado civil, lugar de donde proviene, nivel de educación y tipo de trabajo. Estas variables que vamos a utilizar, son debido a que nos otorga información suficiente para realizar nuestro modelo. Pero nos basamos en los contenidos vistos en clase durante el semestre para saber cuáles deberíamos mantener y sacar del modelo. Acá hay algunas razones del porque sacamos y mantuvimos algunas variables del modelo original:
- ¿Existen variables que no sean estadísticamente significativas?
- Si, estas son las variables: age, race, union, so_states, ce_states, we_states, y government.
Estas variables no son estadísticamente significativas, se sabe gracias a que mediante un test - T en base a una distribución normal ninguna de estas variables independientes supera el 5% de significancia igual a un T tabulado de 1,96. Pero no son excluidas del modelo por esta razón, ya que dependemos mucho de estos datos.
- ¿Porque hay variables cuya desviación estándar dice “Omitted”?
- Las variables en las que sale esa afirmación en el programa Stata son: ne_states, private, self y educ_lths.
- La gran mayoría de las variables de este modelo son “Dummys”, nuestra hipótesis es que algunas están ocupando espacio de más en el modelo. ¿Por qué?, pues hablemos de un caso hipotético de un modelo cualquiera en que sólo se trate de dos categorías, Hombre y Mujer, y luego se añade una variable dummy por cada categoría ¿Qué ocurrirá?, pues el programa Stata (que es el utilizado para hacer las regresiones lineales) va a omitir las variables agregadas, es decir, el agregar más variables de la misma categoría hará que sean perfectamente correlacionadas (por el principio de multicolinealidad perfecta para una misma categoria). Entonces se debe estimar el modelo sólo con una de las dos variables, ya sea la dummy para mujer o la dummy para hombre, pero no ambas, porque son excluyentes. Dicho esto, habrá algunas variables que deberán salir del modelo, las identificamos gracias a stata porque nos dirá que esos datos deben omitirse de nuestro modelo. Recordar que no es lo mismo omitir datos que eliminar datos, pues los datos que sacaremos de este modelo van a estar representado en las otras variables de la categoría y podrían interpretarse dentro de B0.
- ¿Porque la variable “race” tiene 3 resultados?
- Porque se refiere a tres tipos de resultado según el estudio que recopilaba los datos. Pero no podemos tener una variable dummy que tenga tres resultados, tendremos que dividirla en más variables, es decir, el resultado será 1 si es de raza blanca y 0 de no ser de raza blanca, así que en este caso decidimos que reemplazaremos la variable race usando el comando gen White=race<2, de esa forma si el individuo resulta ser de raza blanca el resultado de la variable White será 1, y en caso de que simplemente no sea de raza blanca el valor será cero.
Según el país estudiado (EE.UU.) esta podría presentar datos relevantes en la investigación, por ejemplo, el sólo hecho de que alguien que no sea de raza blanca solicite un puesto laboral en Estados Unidos reduce las probabilidades de encontrarlo, y si lo encuentra probablemente no sea contratado sólo por no ser de raza blanca, dado que la discriminación laboral en ese país es común para este sector de la población que solicita empleo. De todas formas analizaremos los resultados en el siguiente cuadro extraído de los datos en el mes de abril del año 2007.
...