Regresion Binaria Y Multiple
bernardo000066 de Junio de 2012
2.699 Palabras (11 Páginas)814 Visitas
INSTITUTO TECNOLOGICO DE VERACRUZ
MCI CRISTINA ROMERO LARA
ESTADISTICA II
INVESTIGACION
REGRESION LOGISITCA BINARIA Y MULTIPLE
LOPEZ MORALES BERNARDO E08020652
MELGOZA DOMINGUEZ ELVIA ROSARIO E09020176
11 DEABRIL DE 2012
OBSERVACIONES:
INDICE
Introducción……………………………………………………………………………….3
Capitulo 1
Marco teórico……………………………………………………………………..………5
1.1Definición regresión logística binaria……………………………….………….……6
1.1.2 conceptos fundamentales………………………………………………………6
1.2 regresión lineal múltiple………………………………………………………………7
1.2.1 conceptos fundamentales………...…………………………………………….8
Capitulo 2
Desarrollo del tema…………………………………………………………………….11
2.1 regresión logística binaria ejemplo………………………………………………...12
2.2 regresión lineal múltiple…………………………………………………………….16
Bibliografía……………………………………………………………………………….18
Introducción
El presente trabajo surge de una de la materia Estadística II donde se abordan los siguientes temas:
Regresión Logística Binaria y regresión Múltiple
Regresión Logística Binaria
Una variable binaria es aquella que sólo puede adquirir dos posibles valores (Sí-No, 0-1, Verdadero-Falso, etc.). Las variables binarias constituyen un subconjunto muy importante de las llamadas variables categóricas o cualitativas, las cuales están muy presentes en la economía y las ciencias sociales. En concreto, este tipo de variables juegan un papel fundamental en áreas como la teoría de la decisión y el management.
Cuando se pretende explicar, mediante un modelo de regresión, el comportamiento de una variable (llamada variable endógena o dependiente) en función de los valores que tomen otras (llamadas variables exógenas o explicativas), suele utilizarse un modelo de regresión lineal múltiple (MRLM o MRLG). Ahora bien, como veremos en este math-block, el modelo lineal presenta ciertos problemas serios cuando la variable dependiente es binaria (y, en general,
categórica),lo cual nos llevará a usar modelos de regresión no lineales –específicamente pensados para realizar regresión con variables categóricas.
Regresión Múltiple
Todo estudio econométrico se centra en dos pilares básicos: la teoría y los hechos. La teoría permite derivar un modelo (el modelo económico) que sintetiza la incógnita relevante sobre el fenómeno (la variable endógena) objeto del análisis y del cual deriva el modelo econométrico que permite medirlo y contrastarlo empíricamente. Los hechos se concretan en una serie de datos que denominaremos información muestral. La muestra, a su vez, consiste en una lista
ordenada de valores numéricos de las variables objeto de estudio. En una muestra de corte transversal, diversos agentes económicos de una naturaleza similar proporcionan información solicitada en un mismo instante de tiempo. Alternativamente, el investigador económico trabaja en ocasiones con datos de series temporales, en las que se dispone de información acerca deunidad económica, como puede ser un país, una empresa, a lo largo de tiempo; estas muestras pueden tener frecuencia diaria, mensual, anual, según frecuencia de observación de los datos.
Una vez que se especifica el modelo y se dispone de la información estadística
convenientemente tratada, se llega a la etapa siguiente del trabajo econométrico: la etapa de estimación. Los resultados de esta etapa de estimación permiten medir y contrastar las relaciones sugeridas por la teoría económica.
En este math-block postularemos una serie de hipótesis básicas de un modelo de regresión múltiple (MRLM) y consideremos los principales métodos de estimación bajo dichas hipótesis.
Veremos que los estimadores obtenidos mediante el método de mínimos cuadrados ordinarios (MCO) son insesgados, eficientes y consistentes. Además, utilizaremos la inferencia basada en los contrastes de hipótesis para apreciar estadísticamente una cierta evidencia empírica.
Finalmente, conoceremos la importancia del MRLM en la predicción y pronóstico de un cierto fenómeno comprendido por la variable endógena.
Capitulo 1
Marco teórico
1.1 Definición Regresión Logística Binaria
Una variable binaria es aquella que sólo puede adquirir dos posibles valores (Sí-No, 0-1, Verdadero-Falso, etc.). Las variables binarias constituyen un subconjunto muy importante de las llamadas variables categóricas o cualitativas, las cuales están muy presentes en la economía y las ciencias sociales.
1.1.2 Conceptos Fundamentales
Modelos con variable dependiente cualitativa
Un modelo de regresión múltiple (no necesariamente lineal) nos permite explicar el
Comportamiento de una variable dependiente Y en función de una serie de variables independientes X1, X2, ..., Xk y de un término de perturbación u, i.e.:
Y f (X X X u) k , ,..., , 1 2 = En el caso particular de que el modelo de regresión sea lineal, tendremos una expresión de la forma:
Y X X u k k = β + β ⋅ + ... + β ⋅ + 1 2 2
(donde usamos la notación X1 = 1 para la “variable” que acompaña al término independiente). El objetivo de la regresión será estimar los parámetros del modelo (en el caso lineal: β1, β2, ..., βk), de forma que el modelo resultante se ajuste lo mejor posible a las observaciones.
Cuando la variable dependiente Y es continua, resulta frecuente utilizar un modelo de regresión lineal múltiple como el anterior. En tal caso la estimación de los parámetros β1, β2, ..., βk se lleva a cabo mediante los métodos de Mínimos Cuadrados (MCO o MCG).
Por otro lado, puede ocurrir que la variable dependiente Y sea una variable cualitativa o categórica, i.e., que Y sólo pueda tomar un conjunto reducido de valores. En tales circunstancias, el modelo de regresión lineal presentará una serie de inconvenientes serios (como veremos en este math-block), por lo que será necesario recurrir a la llamada regresión logística.
A diferencia de la regresión lineal (que, como hemos dicho, suele hacer uso de los métodos de estimación por Mínimos Cuadrados), en la regresión logística se emplean los métodos de Máxima Verosimilitud (MV) para llevar a cabo la estimación de los parámetros del modelo.
En economía, estos modelos de regresión con variable endógena categórica suelen emplearse para explicar la decisión Y que toma un individuo -de entre un número limitado de posibles opciones- a partir de un conjunto de variables explicativas X1, X2, ..., Xk. Así, p.e., supongamos que unos grandes almacenes han de seleccionar una de entre cinco posibles ciudades para ubicar su nueva sede. A fin de optimizar su proceso de elección, sería posible construir un modelo de regresión lineal múltiple que permitiese seleccionar la eventual ubicación en función de una serie de variables explicativas como pueden ser: el tamaño de la
población, el número de otros centros de características similares en la zona, la renta per cápita, etc. Por este motivo, los modelos de variable endógena cualitativa son también llamados modelos de elección discreta.
Dentro de las variables categóricas, podemos distinguir varios tipos:
• Variables categóricas binarias: son aquellas que sólo pueden tomar dos valores (Éxito- Fracaso, 0-1, Sí-No etc.)
• Variables categóricas ordinales: pueden tomar múltiples valores, entre los cuales es posible establecer una relación de orden (Ninguno-Alguno-Muchos, Primero-Segundo- Tercero-Cuarto, Pequeño-Mediano-Grande-Muy Grande, etc.)
• Variables categóricas nominales: pueden tomar múltiples valores, si bien no es posible ordenarlos (Azul-Rojo-Verde-Blanco, Madrid-Sevilla-Barcelona-Alicante-Bilbao, etc.)
En este math-block vamos a centrarnos en el análisis del primer tipo de variable categórica, el de variable binaria.
1.2 Definición Regresión Lineal Múltiple
La regresión lineal nos permite trabajar con una variable a nivel de intervalo o razón, así también se puede comprender la relación de dos o más variables y nos permitirá relacionar mediante ecuaciones, una variable en relación a otras variables llamándose Regresión múltiple. Constantemente en la práctica de la investigación estadística, se encuentran variables que de alguna manera están relacionados entre si, por lo que es posible que una de las variables puedan relacionarse matemáticamente en función de otra
...