ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Regresión Con Variables Ficticias


Enviado por   •  2 de Abril de 2015  •  1.190 Palabras (5 Páginas)  •  444 Visitas

Página 1 de 5

apítulo XII

Regresión con Variables Ficticias

Conceptos y Definiciones

La regresión con variables ficticias (variables dummy) surge por la

necesidad que tiene el investigador de involucrar variables

cualitativas (o de atributos, o de categorías) en un análisis de

regresión sea este simple o múltiple.

En algunas ocasiones el investigador maneja variables como:

 Estado civil (soltero, casado, viudo, divorciado)

 Sexo o género (masculino, femenino)

 Diagnóstico

 Grupo racial (blanco, negro, amarillo)

 Ocupación (sin y con trabajo)

 Zona de residencia (urbano, rural, suburbano)

 Tabaquismo (fumador cotidiano, exfumador, no fumador)

 Peso (muy pesado, medio pesado, poco pesado)

 Religión (católico, testigo, musulman, evangélico)

 Estatura (bajo, mediano, alto)

 Presión sanguínea (hipotenso, normotenso, hipertenso)

 Desempeño (bajo, medio, alto)

 Clima organizacional (favorable, desfavorable, aceptable)

En estos casos, el investigador se esfuerza por la inclusión de una

o más de ellas porque sospecha un grado de contribución importante

al reducir la suma de cuadrados del error y, por lo tanto, a

153

proporcionar estimaciones más precisas (de menor error estándar) de

los parámetros de interés.

Las variables imaginarias (variables falsas o dummy) para poder

incorporarlas en un modelo de regresión deben ser codificadas

convenientemente. La regla es introducir tantas variables imaginarias

como categorías menos uno tenga la variable cualitativa, es decir, si

una variable cualitativa tiene K categorías se introducirán en el

modelo de regresión K-1 variables falsas.

Una variable falsa es una variable que sólo toma un número finito

de valores (como cero y uno) para identificar las diferentes categorías

de una variable cualitativa.

Esta regla sólo es aplicable a aquellos casos en los cuales la

ecuación de regresión tiene una constante o intercepto.

Técnicas de codificación

Para el ejemplo de tabaquismo que se refiere al principio si las

categorías son: fumador, ex fumador (no ha fumado por 5 años o

menos), ex fumador (no ha fumado por más de 5 años), no fuma.

Como existen 4 categorías tendrán que crearse 3 variables falsas así:

X1= (1: para fumador, 0 para otro caso)

X2= (1: para ex fumador <=5 años; 0: para otro caso)

X3= (1: para ex fumador > 5 años; 0: para otro caso)

En otros casos (Gujarati,1997) , la codificación se puede establecer

así:

Sea por ejemplo, el estudio del precio por onza de cola en función

del tipo de almacén (descuento, cadena o de conveniencia), producto

de marca o sin marca, llenado del envase.

154

Para almacén crea una sola variable D1 (dummy 1) que se

codificará con 001 (si es un almacén de descuento), con 010 (si es

almacén de cadena) y con 001 (si es almacén de conveniencia).

Para producto de marca crea una sola variable D2 (dummy 2) que

codificará con 10 (si es un producto de marca) y como 01 (si es un

producto sin marca).

Para el llenado del envase codificará así:

D3= 0001 (botella de 2 litros o 67,6 onzas)

= 0010 (botella de un litro o 28-33,8 onzas)

= 0100 (botella de 16 onzas)

= 1000 (latas de 12 onzas)

El comentario acerca de esta codificación plantea dos reflexiones

una es que ocasiona la misma magnitud de disminución del error

estándar del estimador, lo cual es favorable, pero por otro lado los

resultados son más difíciles de interpretar. Con esta codificación

también se tienen que crear menos variables y esto es una economía

en el análisis. Si codificamos por la primera forma tendríamos que

haber creado para el llenado del envase tres variables dummy porque

tiene 4 categorías.

El comentario final sería codificar con 1 (uno) la categoría de

interés y como 0 (cero) la otras. Esto facilitará la interpretación de los

resultados.

Modelos de Regresión con variables falsas

Con tres variables (ejemplo del precio botellas de cola)

1 2 3 0 1 2 3P  b bD  b D b D

Donde:

P: Precio

D1= tipo de almacén

D2=

...

Descargar como (para miembros actualizados)  txt (9.6 Kb)  
Leer 4 páginas más »
Disponible sólo en Clubensayos.com