“DISEÑO DE UN MODELO DE REGRESIÓN LINEAL PARA LOS SALARIOS DE JUGADORES DE BASEBALL DE LA MLB EN 1992 SEGÚN SU PERFORMANCE Y OTROS.”.
luis salasTarea21 de Abril de 2016
7.277 Palabras (30 Páginas)625 Visitas
[pic 2]
INFORME FINAL ECONOMETRÍA.
“DISEÑO DE UN MODELO DE REGRESIÓN LINEAL PARA LOS SALARIOS DE JUGADORES DE BASEBALL DE LA MLB EN 1992 SEGÚN SU PERFORMANCE Y OTROS.”.
CASA CENTRAL – VALPARAÍSO
[pic 3]
PROFESOR:
Pedro Fernández de la Reguera.
AYUDANTE:
Alejandro Sierra
ALUMNO:
- Jaime Rivera
- Leonardo Biso
- Luis Salas
RESUMEN EJECUTIVO
La investigación a través de la red permitió encontrar una base de datos consistente, esta explica los salarios de los jugadores de béisbol de la Liga Mayor en 1992, asociado a múltiples variables interesantes de estudiar, entre las cuales se encuentran las asociadas a medidas individuales y grupales de desempeño. Se decidió acotar la muestra en 71 observaciones, lo cual no generó problemas en el modelo, pues los datos son tomados en un mismo año y a una misma clase de jugadores. Se consideraron sólo 7 variables explicativas, pues muchas de las que contenía la base de datos correspondían a la sumatoria de otras o no insidian directamente en el modelo. Además se decidió (en base a estudios previos), que la variable endógena debería ser el logaritmo del salario, ya que soluciona ciertos problemas que implica el utilizar solo el salario de los jugadores.
Luego en base a métodos de construcción de modelos, se obtuvo como resultado el siguiente modelo:
log(Y) = 2,09561 + 0,00596509 *N° carreras impulsadas + 0,0138977*N° de dobles + 0,44743* Ind elegibilidad
Con este modelo se realizó el análisis de residuales, lo que resultó en la eliminación de 3 observaciones que eran simultáneamente atípicas e influyentes. El modelo final fue:
log(Y) = 2,08882 + 0,00693771*N° carreras impulsadas + 0,0146007*N° de dobles + 0,402847 *Ind elegibilidad
Ya con este modelo construido, se prosiguió a comprobar los supuestos del modelo, primero comprobando la normalidad del error a través del método de Shapiro-Wilk. Después se aseguró que no existe un problema grave de multicolinealidad y finalmente se descartó un problema de Heterocedasticidad. Cabe destacar que no se analizó el problema de autocorrelación debido a que este pertenece principalmente a datos de corte longitudinal, mientras que los datos de este caso son de corte transversal (en un solo periodo de tiempo).
Como resultado final, se tiene el modelo expresado, sin problemas en sus supuestos, pudiendo verificar la hipótesis de que el salario tiene una relación directa con el rendimiento de los jugadores. También se rechazó la hipótesis de la influencia de la raza en el salario de los jugadores, y finalmente se acepta la hipótesis del efecto en la libertad de elegibilidad de agencia en el salario de los jugadores de esta liga de baseball.
Tabla de contenido
I. Resumen ejecutivo
II. INTRODUCCIÓN
III. Definición de las variables
Variable endógena
Variables exógenas:
IV. METODOLOGÍA
Pasos:
V. Resultados y Conclusiones
Construcción del modelo:
Análisis de Residuales
Normalidad del Error
Homocedasticidad
Conclusiones
VI. Referencias
VII. Anexos
Anexo A: Muestra inicial (72 datos)
Anexo B: Muestra final (68 datos)
Anexo C: Shapiro Wilk
Anexo D: Modelo auxiliar de White
Anexo E: Goldfeld-Quandt para X2
Anexo F: Goldfeld-Quandt para X3
Anexo G: Dócima de Park para X2
Anexo H: Dócima de Park para X3
INTRODUCCIÓN
La econometría es la ciencia que tiene como objetivo explicar una variable en función de otras variables, es por esto que el punto base para el análisis econométrico es especificar un modelo que permita cuantificar y estimar parámetros otorgando una base empírica, que nos permita analizar y verificar la incidencia del modelo planteado. La estimación del modelo, corresponde a la fase estadística, en la cual se estima, valga la redundancia, los parámetros de las ecuaciones del modelo que posteriormente permitirán la aplicación del modelo para explicar aquello que nos interesa.
Medidas bien definidas de rendimiento están disponibles para los jugadores de béisbol, por lo que el modelado de sus salarios es un ejercicio estadístico popular. En el artículo empleado como fuente de datos para el estudio, se proporcionan los salarios de los no lanzadores para la temporada de béisbol de la Liga Mayor de 1992, junto con numerosas medidas de las actuaciones de años anteriores de estos jugadores. También se incluyen indicadores de la capacidad de cada jugador para cambiar de equipo. Este conjunto de datos es útil en el análisis de regresión, ya que presenta muchas dificultades "mundo real" que pueden remediarse mediante técnicas descritas en el curso de econometría.
La base de datos fue obtenida por un artículo de Watnik, (1998) , profesor de estadística y bioestadística de la Universidad de California, además cabe mencionar que la base original corresponde a 337 observaciones y 18 variables explicativas.
Se decidió acotar la muestra a 71 observaciones, pues la muestra era muy grande, esto no generará problemas en el modelo ya que los datos son tomados en un mismo año y de una misma clase de jugadores. Se tomó una muestra aplicando la técnica de muestreo aleatorio simple utilizando el software estadístico Minitab 16. Por otro lado el modelo cuenta con 7 variables exógenas porque muchas de ellas eran la sumatoria de otras variables o se encontró que no insidian en el modelo. Además en base a los nombres de cada jugador (incluido en la base de datos original), se investigó la raza de los mismos, para agregarla al análisis.
Las hipótesis planteadas como equipo fueron las siguientes:
- : Los parámetros estimados (coeficientes) asociados a variables de rendimiento son positivos, pues todas las variables exógenas por lo que se sabe del béisbol debieran influir de manera directamente proporcional con el sueldo de los jugadores de la liga mayor. A medida que la variable X aumenta Y también debiese aumentar.
- Se considera que la raza del jugador podría generar un efecto en el sueldo final de los jugadores, pues podría influir en el rendimiento deportivo, el cual se ve reflejado a lo largo de la historia del béisbol. Además se podría considerar un efecto de discriminación que pueda influir en la variable endógena, lo cual ha sido estudiado por varios autores del tema (Pascal & Rapping, 1970; Christiano , 1986).
- El índice de libre elegibilidad de agencia, corresponde a cuando el jugador es capaz de elegir su equipo a elección propia, al igual que representa la independización de su manager, se consideró que esta podría generar un efecto favorable en el sueldo, pues de esta forma casi el 100% del sueldo podría ser del jugador. Además esto nos dice que el jugador tiene experiencia, lo cual debería verse reflejado en el salario. Esta hipótesis también ha sido propuesta por otros autores (Hadley & Gustafson, 1991).
.
Definición de las variables
Se consideró que la población de interés es el conjunto de la Liga Mayor Jugadores (MLB) de béisbol que jugó al menos un partido, tanto en las temporadas de 1991 y 1992, con exclusión de los lanzadores. Este conjunto de datos contiene los salarios para la población del año 1992, junto con las medidas de rendimiento para cada jugador desde 1991 a 1992. Cuatro variables categóricas indican cómo cada jugador libre iba a pasar a otros equipos.
...