ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

El análisis de concordancias sobre variable y ordinales


Enviado por   •  1 de Julio de 2013  •  Exámen  •  1.815 Palabras (8 Páginas)  •  793 Visitas

Página 1 de 8

Aplicar el análisis de concordancias sobre variable y ordinales

La concordancia entre diferentes métodos cuyo resultado es una variable cuantitativa. Ahora se trata de medir el grado de acuerdo entre varios métodos o evaluadores que clasifican al paciente (o el resultado de una observación) según una serie de posibilidades (categorías) mutuamente excluyentes. El caso más sencillo se presenta cuando la variable cualitativa es dicotómica (dos posibilidades) y se está comparando dos métodos de clasficación (por ejemplo dos escalas clínicas). Esta situación se puede representar en una tabla de frecuencias:

Método B

Positivo Negativo

Método A Positivo a c f1

Negativo b d f2

c1 c2 n

La medida más simple de concordancia es la proporción de coincidencias frente al total de sujetos:

(a + d) / n.

Pero resulta que aunque no existiera ninguna relación entre los dos métodos de clasificación, está claro que es previsible que encontremos algún grado de concordancia entre ellos por puro azar. Así, si el método A consiste en clasificar al paciente con resultado positivo si sale cara al lanzar una moneda al aire y cruz en el caso contrario, y hacemos lo mismo en el método B (con otra moneda diferente), es previsible encontrar en promedio del orden de un 50 % de coincidencias.

Supongamos que el sistema A es un método científico de diagnóstico y el método B es la opinión de un "vidente";también ahora es previsible encontrar un cierto grado de concordancia debido en parte al azar.

Con el fin de determinar hasta qué punto la concordancia observada es superior a la que es esperable obtener por puro azar, se define el índice de concordancia kappa de la siguiente manera:

Donde Po es la proporción de concordancia observada (en tanto por 1) y Pe es la proporción de concordancia esperada por puro azar. En caso de acuerdo perfecto la proporción de concordancia será 1, por lo que 1-Pe representa el margen de acuerdo posible no atribuíble al azar. De ese margen nosotros observamos probablemente sólo una parte Po-Pe, salvo que haya acuerdo perfecto Po=1.

Así pues en caso de concordancia perfecta el valor de kappa es 1; si la concordancia observada es igual a la esperada kappa vale 0; y en el caso de que el acuerdo observado sea inferior al esperado el índice kappa es menor que cero.

Para calcular Pe, la concordancia esperada, el razonamiento es el siguiente: de acuerdo con la tabla anterior la probabilidad de que el método A clasifique a un sujeto como positivo podemos estimarla como f1/n; mientras que la correspondiente probabilidad del método B la estimaremos como c1/n. Si consideramos que existe independencia entre ambos métodos de clasificación, la probabilidad de que coincidan clasificando al mismo sujeto como positivo será entonces el producto de las dos probabilidades (sucesos independientes). Aplicando el mismo razonamiento calculamos la probabilidad de que se produzca acuerdo entre los métodos al clasificar a un sujeto como negativo, y entonces la probabilidad de acuerdo cualquiera de las dos clasificaciones será la suma de ambos valores, esto es:

El coeficiente kappa fue propuesto originalmente por Cohen (1960) para el caso de dos evaluadores o dos métodos, por lo que a menudo se le conoce como kappa de Cohen, y fue generalizado para el caso de más de dos evaluadores por Fleiss, por lo que a veces también se habla del índice kappa de Fleiss.

Landis y Koch propusieron unos márgenes para valorar el grado de acuerdo en función del índice kappa:

kappa grado de acuerdo

< 0 sin acuerdo

0 - 0,2 insignificante

0,2 - 0,4 bajo

0,4 - 0,6 moderado

0,6 - 0,8 bueno

0,8 - 1 muy bueno

Este índice se puede generalizar para clasificaciones multinomiales (más de dos categorías) y para más de dos evaluadores, siendo similar su interpretación.

En el caso de más de dos categorías, además del índice de concordancia global puede ser interesante determinar el grado de concordancia específico en alguna de las categorías (o en todas), lo que equivale a convertir el resultado posible en dos únicas respuestas: se clasifica al paciente en la categoría de interés o se clasifica en alguna de las restantes. De esta manera para cada una de las categorías vamos convirtiendo la tabla original en tablas 2x2 y podemos entonces calcular el valor del correspondiente índice kappa como si de una variable dicotómica se tratara.

La gran utilización del índice de concordancia kappa en la literatura médica se debe probablemente tanto a la facilidad de cálculo, como a su clara intepretación; no obstante, tiene sus problemas y limitaciones que pueden consultarse por el lector interesado en la bibliografía que acompaña este artículo. El principal problema de esta medida de concordancia radica en que está pensada para clasificaciones nominales, en las que no existe un orden de graduación entre las diferentes categorías. Cuando esto no es así, pensemos por ejemplo en una clasificación del tipo Muy grave - grave - leve - sin importancia, donde no es lo mismo que el desacuerdo se produzca clasificando como sin importancia por un evaluador y leve por otro, a que uno de ellos clasifique como sin importancia y otro como muy grave. El índice kappa hasta ahora descrito únicamente tiene en consideración si hay o no acuerdo, esto es si se clasifica o no al sujeto en la misma categoría, por lo que a la hora de calcularlo pesan por igual las dos situaciones anteriormente descritas.

Si deseamos tener en cuenta el hecho de que estamos manejando variables ordinales para calcular una medida de concordancia, existen diferentes posibilidades. La más sencilla es calcular individualmente la concordancia en cada categoría, tal y como se comentó más arriba; pero de esta forma seguimos sin ponderar el nivel de desacuerdo global según esa clasificación ordinal. Otro enfoque más global consiste en asignar un peso a las diferentes posibilidades de desacuerdo, de tal manera que se considere como más importante un desacuerdo entre categorías alejadas que entre las próximas. Este peso variará entre 0 (acuerdo, misma categoría) y 1 (desacuerdo con categorías extremas). El problema surge a la hora de determinar esos pesos, ya que el valor de concordancia obtenido será diferente según los pesos utilizados. En uno de los enlaces seleccionados se describen los pesos más habitualemente utilizados (lineales o bicuadrados) y que suelen proporcionar por defecto los programas de ordenador.

MEDIDAS DE ASOCIACIÓN PARA DATOS ORDINALES

En el cuadro de diálogo Tablas de contingencia: Estadísticos pueden activarse diversas opciones que proporcionan medidas de asociación cuando las variables se miden por lo menos en una escala ordinal; las más utilizadas son:

1. Correlaciones: con esta opción se obtienen los estadísticos:

• Coeficiente de correlación de Pearson: es una medida de asociación lineal adecuada para variables medidas en escala de intervalo *.

• Coeficiente de correlación de Spearman: mide el grado de correspondencia que existe entre los rangos que se asignan a los valores de las variables analizadas. Por ello, este coeficiente se puede calcular con datos ordinales, y se define: , siendo di la diferencia entre los rangos correspondientes a la observación i-ésima. El coeficiente toma valores entre -1 y +1. Un valor cercano a 0 indica que las variables apenas están relacionadas.

El cuadro Ordinal recoge una serie de estadísticos basados en el número de concordancias y discordancias que aparecen al comparar las puntuaciones asignadas a los mismos casos según dos criterios (o jueces) diferentes. Así, por ejemplo, si recoge las puntuaciones asignadas a los casos según el primer criterio y según el segundo, para la obtención de concordancias y discordancias que aparecen entre los dos criterios, se procede de la siguiente forma:

• se ordenan los pares de puntuaciones de acuerdo con el orden natural de las puntuaciones asignadas según el primer criterio, .

• se compara cada valor de con cada uno de los que le siguen, y se registra una concordancia (+1) cuando los dos valores siguen el orden natural, una discordancia (-1) cuando el orden está invertido y un empate (0) cuando coinciden ambas puntuaciones.

• se calculan C total de las concordancias, D total de las discordancias y E el número total de empates.

El número total de comparaciones es incluyendo empates.

1. Gamma: El estadístico Gamma se define como Este análisis excluye los casos que presentan la misma puntuación en las dos variables (empates).

2. Tau-b de Kendall. Este coeficiente incluye los empates contemplando por separado los que aparecen en la variable y los que aparecen en la variable .

Se define como

3. Tau-c de Kendall. Este estadístico se define como siendo k el menor número de casos no empatados que presentan o

4. d de Somers:

A diferencia de los anteriores este estadístico considera que las variables pueden ser simétricas o dependientes. En el primer caso, el estadístico d de Somers coincide con la Tau-b de Kendall. En el segundo supuesto, se diferencia del estadístico Gamma en que incluye los empates de la variable que considera dependiente. Si la variable dependiente es

Todas estas medidas toman valores entre -1 y +1, y alcanza los valores extremos cuando existe concordancia o discordancia perfecta. Valores próximos a 0 indican ausencia de asociación.

EJEMPLO

Ejemplo 1.

Obtenga una tabla de contingencia con las frecuencias absolutas, relativas y condicionadas para las variables Trans (tipo de transporte) y Resid (vive en Barcelona) de la base de datos Enctran.sav, y el correspondiente diagrama de barras.

En el cuadro de diálogo Tablas de contingencia se activa la opción Mostrar los gráficos de barras agrupadas, y en el cuadro de diálogo Tablas de contingencia > Casillas se activan las opciones Porcentajes Fila, Columna y Total.

En la tabla de contingencia se observan, entre otros resultados, los siguientes:

- Un total de 53 personas utilizan el metro de las cuales 41 viven en Barcelona y 12 no.

- El 36% del total de casos de la muestra utilizan el metro y viven en Barcelona.

- El 58,6% de los que viven en Barcelona utilizan el metro.

- El 77,4% de los que utilizan el metro viven en Barcelona.

- El 10,5% del total de casos utilizan el metro y no viven en Barcelona.

- El 27,3% de los que no viven en Barcelona utilizan el metro.

-El 22,6% de los que utilizan el metro no viven en Barcelona.

Análogamente se interpretan el resto de resultados.

Ejemplo 2.

Obtenga la tabla de contingencia para las variables del ejemplo anterior con frecuencias observadas, esperadas y resíduos no tipificados.

La observación de los residuos permite tener una primera aproximación sobre la existencia de asociación entre las variables. Si los residuos en valor absoluto son próximos a 0 se espera que la hipótesis de independencia entre las variables no se pueda rechazar. Por el contrario, cuantos mayores sean los valores absolutos de los residuos se tendrán más indicios sobre la existencia de asociación. En cualquier caso, la confirmación de la existencia o no de asociación entre las variables se obtiene a partir de los estadísticos correspondientes. En este ejemplo se observan unos valores de los residuos, en general, elevados, lo que nos lleva a pensar en la existencia de asociación entre el tipo de transporte y el lugar de residencia.

...

Descargar como  txt (11.3 Kb)  
Leer 7 páginas más »
txt