Resumen Libro Econometría Gujarati
DunterResumen6 de Junio de 2020
12.378 Palabras (50 Páginas)2.656 Visitas
[pic 1]
Universidad de Santiago de Chile
Departamento de Administración y Finanzas
Ingeniería Comercial - I Semestre Vespertino
“Resumen Capítulos
1, 2, 3, 6, 7, 8, 10, 11, 12, 15 y 16
Damodar N. Guajarati”
Capítulo 1
Naturaleza del análisis de regresión
- Origen histórico del término de regresión
El término de regresión fue introducido por Francis Galton, quien planteó que, a pesar de la presencia de una tendencia en la que los padres de estatura alta tenían hijos altos y los padres de estatura baja tenía hijos bajos, la estatura promedio de los niños nacidos de padres de una estatura dad tendía a moverse o regresar hacia la estatura promedio de la población total (Ley de regresión universal).
- Interpretación moderna de la regresión
El análisis de regresión se trata del estudio de la dependencia de la variable dependiente, respecto a una o más variables (explicativas), con el objeto de estimar y/o predecir la media del valor promedio poblacional de la primera en términos de los valores conocidos o fijos (en muestras repetidas) de las últimas.
- Relaciones estadísticas versus relaciones determinísticas
En el análisis de regresión nos interesa lo que se conoce como dependencia estadística entre variables, pero no la funcional o determinística propia de la física clásica.
- Relaciones estadísticas entre variables: trata esencialmente con variables aleatorias o estocásticas, variables que tienen distribuciones de probabilidad. Por ejemplo, la dependencia del producto de una cosecha agrícola respecto a la temperatura ambiente, lluvia, sol, y fertilizantes.
- Relaciones determinísticas: trata con variables que no son aleatorias o estocásticas. Como por ejemplo, ley de gravedad de Newton, ley de electricidad de Kirchhoff, etc.
- Regresión versus causalidad
Kendall y Stuart: “Una relación estadística, sin importar que tan fuerte y sugestiva sea, nunca podrá establecer una conexión causal, nuestras ideas de causalidad deben venir de estadísticas externas y, en último término de una u otra teoría”
Una relación estadística no puede por si misma implicar en forma lógica una causalidad. Para aducir causalidad, se debe acudir a consideraciones a priori o teóricas.
- Regresión versus correlación
El análisis de correlación está estrechamente relacionado con el de regresión aunque conceptualmente son muy diferentes.
El análisis de correlación, su objetivo principal es medir la fuerza o el grado de asociación lineal entre dos variables.
El análisis de regresión, trata de estimar o predecir el valor promedio de una variable sobre la base de valores fijos de otras variables.
Diferencia entre el análisis de regresión y la correlación:
- En el análisis de regresión hay una asimetría en el tratamiento que se da a las variables dependientes y explicativas. La variable dependiente es estadística, aleatoria o estocástica. Se da por hecho que las variables explicativas tiene valores fijos (en muestras repetidas. La mayor parte de la teoría de regresión, está condicionada al supuesto de que la variable dependiente es estocástica, pero las variables explicativas son fijas o no estocásticas.
- El análisis de correlación, trata dos variables cualquiera en forma simétrica, no hay distinción entre la variable dependiente y las explicativas. La mayor parte de la teoría de correlación está basada en el supuesto de aleatoriedad de variables.
- Terminología y notación
Análsis de regresión simple o con dos variables: estudio de la dependencia de una variable en una única variable explicativa.
Análisis de regresión múltiple: estudio de la dependencia de una variable en más de una variable explicativa.
- Naturaleza y fuentes de información para el análisis econométrico
Tipos de datos; puede haber tres tipos de datos disponibles para el análisis empírico:
- Series de tiempo: es un conjunto de observaciones sobre los valores que toma una variable en diferentes momentos del tiempo (diaria, semanal, quincenal, semanal, anual, etc).
- De corte transversal: datos de una o más variables recogidos en el mismo momento del tiempo.
- Información combinada: los datos agrupados tienen elementos de series de tiempo y de corte transversal reunidos.
Hay un tipo especial de datos agrupados, la información de panel o longitudinal o información de micropanel, en la cual la misma unidad de corte transversal, es encuestada a través del tiempo.
Fuentes de información; los datos utilizados en el análisis empírico se recolectar por una agencia gubernamental, organizaciones privadas, internet, etc. La información reunida por estas agencias puede ser de naturaleza experimental o no experimental.
Precisión de la información:
Se debe tener presente la calidad de la información y en ese contexto, existen una serie de consideraciones a tener presente:
- Información de las ciencias sociales: es de naturaleza no experimental, existe una posibilidad de incurrir en errores de observación, por acción u omisión.
- Información de ciencias naturales: es de naturaleza experimental, surgen errores de medición debido a las aproximaciones o redondeo.
- Información de encuesta tipo cuestionario: respuestas en blanco pueden ser graves, el análisis basado de tal respuesta parcial puede no reflejar verdaderamente el comportamiento del % que no respondió, ocasionando lo que se conoce como sesgo de selectividad (muestral). No responder a preguntas de naturaleza financiera; sesgo adicional de selectividad.
- Los métodos de muestreo utilizados en la obtención de datos pueden variar tanto que frecuentemente es difícil comparar los resultados obtenidos de las diversas muestras.
- Las cifras económicas generalmente están disponibles a niveles altamente agregados (Ej: macro datos).
- Debido a su carácter confidencial, cierta información puede ser publicada solamente en forma muy agregada (Ej. SII).
- Debido a múltiples problemas, el investigador debe tener siempre en mente que el resultado de la investigación solamente será tan bueno como lo sea la calidad de los datos. Resultados insatisfactorios = mala calidad de datos y no la utilización de un modelo equivocado.
Observación sobre las escalas de medición de las variables
Las variables se clasifican en cuatro catergorías generales:
- Escala de proporción: Para la variable X, al tomar dos valores (X1 y X2), la proporción (X1/X2) y la distancia (X1-X2) son cantidades que tienen sentido. Existe un ordenamiento natural (ascendente y descendente) de los valores a lo largo de la escala. Por lo tanto, también tiene sentido comparaciones como
X2 ≤ X1, o X2 ≥ X1. La mayoría de las variables económicas pertenecen a esta categoría.
- Escala de intervalo: una variable de escala de intervalo satisface las dos últimas propiedades (distancia y ordenamiento natural), pero no la primera (proporción). La distancia entre 2 períodos es significativa 2000 – 1995 no así la proporción entre dichos períodos. (2000/1995).
- Escala ordinal: una variable pertenece a esta categoría sólo si satisface la tercera propiedad de la escala de proporción (orden. natural) EJ: sistema de calificaciones (A, B, C) o clases de ingresos (alto, medio, bajo). Para estas variables existe el orden pero las distancias entre las categorías pueden no cuantificarse.
- Escala nominal: las variables de esta categoría no tienen ninguna de las características de las variables de escala de proporción. Simplemente denotan categorías: género (masculino, femenino), estado civil (soltero, separado, etc.)
Capítulo 2
Análisis de regresión con dos variables
Regresión bivariable o de dos variables: la variable dependiente (regresada) se relaciona con una sola variable explicativa (regresora).
El análisis de regresión se relaciona en gran medida con la estimación y/o predicción de la media (de la población) o valor promedio de la variable dependiente (Y), con base a los valores conocidos o fijos de las variables explicativas.
Los valores medios para las sub poblaciones de Y los conocemos como valores esperados condicionales, en vista de que dependen de los valores dados a la variable (condicional) X. Simbólicamente se denota E(Y/X) el valor esperado de Y, dado el valor de X.
El valor esperado incondicional: (∑ Y/n), es incondicional en el sentido de que para obtener esta cifra se hace caso omiso de los niveles de ingresos de diversas familias.
Recta de regresión Poblacional (RRP): obtenemos la RRP o la CRP con la unión de los valores de las medias condicionales, que es la regresión de Y sobre X. Una CRP es el lugar geométrico de las medias condicionales de la variable dependiente para los valores fijos de la variable(s) explicativa(s). Es la curva que conecta las medias de las sub poblaciones de Y que corresponden a los valores dados del regresor X.
...