ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Biogefgrafia

Mishelltopita11 de Mayo de 2014

2.954 Palabras (12 Páginas)177 Visitas

Página 1 de 12

Tema 2. Asociación estadística, dependencia funcional e independencia

Objetivos del tema 2

En este tema aprenderás a:

• Diferenciar la asociación estadística, dependencia funcional e independencia.

• Reconocer el tipo de relación entre dos variables de una tabla comparando las frecuencias condicionales

• Calcular las frecuencias esperadas en caso de independencia

• Analizar posibles explicaciones de una asociación estadística: relación causal, interdependencia, tercera variable explicativa o asociación espuria

Walter Frank Raphael Weldon

2.1. Introducción

En el tema anterior has aprendido a representar los datos en tablas de contingencia e interpretar las frecuencias absolutas dobles.

En muchas ocasiones al investigador le interesa saber si las dos variables presentadas en una tabla de contingencia están interrelacionadas entre sí. En este tema vamos a aclarar que entendemos por asociación estadística y a diferenciarla de la dependencia funcional y de la independencia. También aprenderemos a diferenciar entre relación causal y asociación y a estudiar diferentes situaciones que pueden llevar a la existencia de asociación.

2.2. Dependencia funcional y dependencia aleatoria

Comenzamos recordando la dependencia funcional que has estudiado en matemáticas y física. En algunos estudios donde se analizan dos variables observamos que, conociendo el valor de una de las variables podemos saber el valor exacto de la otra variable, ya que hay una formula matemática que las relaciona.

En la vida diaria podemos buscar ejemplos de estas dependencias funcionales, como es el caso de la relación entre especio recorrido y velocidad de un móvil, para un intervalo de tiempo fijo. Como vemos en la tabla 2.1., dando valores distintos al espacio para un intervalo fijo de 5 horas, nos da como resultado un único valor para cada valor del espacio, de forma exacta, pues las variables están relacionadas por la ecuación:

; V = velocidad; e = espacio; t = tiempo

Tabla 2.1. Velocidad – espacio

Velocidad (Km/h) 5 10 15 20 25 30 35 38 40 44 48 50 60

Espacio (Km) 25 50 75 100 125 150 175 190 200 220 240 250 300

Figura 2.1. Relación entre velocidad – espacio

Observamos en la Figura 2.1. que en caso de dependencia funcional, al representar gráficamente las variables, obtenemos una línea que pasa por todos los puntos. En este tipo de relación, los valores que toma la variable Y quedan determinados, de un modo preciso, por los valores que toma la otra variable, que se considera como independiente.

2.3. Dependencia aleatoria

Existen casos en los que no se puede establecer con exactitud una formula que relacione dos variables, esto no quiere decir que no exista una cierta relación. Un caso es si queremos relacionar el coeficiente de inteligencia con las notas de una cierta prueba, es lógico pensar que cuanto más alto es el coeficiente de inteligencia la nota será mejor, aunque esto no ocurra en todos los casos o pueda variar ligeramente. Este tipo de dependencia llamaremos dependencia aleatoria. Si dichos pares de valores los representamos en un sistema cartesiano, los puntos, en general, no se ajustan de un modo preciso a una función matemática, sino que se obtiene un conjunto de puntos más o menos dispersos. Una representación de ese tipo recibe el nombre de nube de puntos o diagrama de dispersión.

El estudio de la posible relación entre dos variables cuantitativas suele iniciarse mediante la observación del correspondiente diagrama de dispersión o "nube de puntos”. La presencia de una relación entre las variables se pondrá de manifiesto en el diagrama por una cierta tendencia de los puntos a acumularse en las proximidades de una línea. La relación será más intensa cuanto más concentrados estén los puntos y puede ser directa (si a mayor valor de una variable se da mayor valor de la otra) o inversa (a mas valor de una variable se da menor valor de la otra). En la Actividad 2.1 puedes ver algunos ejemplos de dependencia aleatoria en variables numéricas.

2.4. El concepto de asociación

En algunos estudios nos interesa analizar si dos variables cualitativas están relacionadas entre sí. Para ello, se comienza estudiando los datos, representados en una tabla de contingencia. Al tratar de estudiar si existe o no una relación entre dos variables estadísticas, tratamos de contestar a las preguntas siguientes:

1. ¿Hay algún tipo de relación entre las variables?

2. ¿Podría medir la intensidad de esta relación mediante un coeficiente (coeficiente de asociación)?

3. ¿Sirve este coeficiente para poder comparar la intensidad de la relación de diferentes variables? ¿Cómo puedo interpretarlo?

En este tema estudiaremos la primera pregunta, y en los siguientes las preguntas 2 y 3.

Ejemplo 2.1. Trastorno digestivo

Se quiere estudiar si un cierto medicamento produce trastornos digestivos en los ancianos. Para ello se han observado durante un periodo de tiempo a 25 ancianos obteniendo los siguientes resultados.

Sintomatología digestiva según se toma o no una medicina

Molestias digestivas No tiene molestias Total

Toma la medicina 9 8 17

No la toma 7 1 8

Total 16 9 25

Utilizando los datos de la tabla, razona si en estos ancianos, el padecer trastornos digestivos está relacionado con haber tomado o no el medicamento, indica cómo has usado los datos.

Observa que, de los ancianos que toman la medicina, más o menos la mitad tienen molestias, pero de los que no la toman 7 de cada 8 las tienen. Por lo tanto, es más frecuente que tomen la medicina los que tienen molestias, o lo que es lo mismo las variables están asociadas. Si no lo estuvieran, lo que esperaríamos es que la proporción de los ancianos con molestias fuesen igual en los dos grupos.

En el ejemplo 2.1 vemos que, para concluir si las dos variables que forman una tabla de contingencia son dependientes o independientes se requiere un proceso de cálculo a partir de las frecuencias de la tabla. Podemos encontrar una variedad de situaciones, mostramos en la Figura 2.2. En el caso c) observamos que a cada valor de la variable X corresponde un solo valor de la variable Y y viceversa. Es claro que en este caso las variables están asociadas, y más aún se trataría de una asociación perfecta pues con toda seguridad podemos predecir el valor que tomara Y sabiendo el valor de X y viceversa.

Figura 2.2. Diferentes tipos de asociación

a) Independencia total

Y1 Y2 Y3 Total

X1 10 20 70 100

X2 20 40 140 200

Total 30 60 210 300

b) Asociación parcial

Y1 Y2 Y3 Total

X1 10 80 10 100

X2 80 20 100 200

Total 90 100 110 300

c) Asociación perfecta

Y1 Y2 Y3 Total

X1 100 100

X2 200 200

X3 100 100

En el caso a) independencia, observamos que las frecuencias absolutas dobles de los valores de Y1, Y2, Y3 son proporcionales en X1 y X2. Es decir, las frecuencias relativas condicionales de los valores de Y1, Y2, Y3 son iguales en X1 y X2. Diremos que las variables son independientes pues las frecuencias relativas condicionales de una de ellas no dependen del valor de la otra.

Los casos a) y c) tienen solo interés teórico pues lo más frecuente es encontrarse en el caso b) donde hay una asociación parcial en los datos, que sería el caso correspondiente al ejemplo, En este caso las frecuencias absolutas dobles de los valores de Y1, Y2, Y3 no son proporcionales en X1 y X2. Es decir, las frecuencias relativas condicionales de los valores de Y1, Y2, Y3 son diferentes en X1 y X2 Lo que nos va interesar desde el punto de vista estadístico es saber cuando esta relación seria estadísticamente significativa y cuál sería la intensidad de esta relación.

2.5. Independencia

Un método usual para conocer la independencia entre dos variables es mediante el estudio de las distribuciones condicionales. Para ello se calculan las distribuciones condicionales. En el caso de que coincidan, se puede afirmar que las dos variables son independientes.

Ejemplo 2.2. Insomnio y estrés.

Se pretende estudiar si el sufrir insomnio tiene relación con los trastornos de estrés. En una muestra de 250 personas observadas se obtuvieron los siguientes resultados:

Padece estrés No padece estrés Total

Tener insomnio 90 60 150

No tener insomnio 60 40 100

Total 150 100 250

Aparentemente, las variables están relacionadas, pues la celda donde hay mayor frecuencia es en las personas que tienen estrés e insomnio. ¡Pero sería un error basar el juicio de asociación en los datos de una sola celda de la tabla!

Para analizar la asociación podemos comparar la proporción de personas con insomnio entre los que tienen estrés y los que no lo tienen. Obtendríamos la siguiente tabla de frecuencias relativas condicionales por columnas:

Padece estrés No padece estrés Total

Tener insomnio 90/150=0,6 60/100=0,6 150/250=0,6

No tener insomnio 60/150=0,4 40/100=0,4 100/250=0,4

Total 150 100 250

En dicha tabla observamos que la proporción de personas con insomnio y sin insomnio es la misma entre los que tienen estrés y los que no lo tienen. Es decir frecuencias relativas condicionales por columnas son iguales.

Por otro lado, estas frecuencias relativas condicionales

...

Descargar como (para miembros actualizados) txt (21 Kb)
Leer 11 páginas más »
Disponible sólo en Clubensayos.com