Validez Y Confiabilidad
zimbadz28 de Mayo de 2012
3.923 Palabras (16 Páginas)3.815 Visitas
VALIDEZ Y CONFIABILIDAD
Todas las mediciones se caracterizan por la mayor o menor presencia de dos atributos: (a) confianza (o qué tan confiable es la medición) y (b) validez (o qué tan válida es una medición).
Una medición es “confiable” si podemos esperar en forma razonable que los resultados de dicha medición sean sistemáticamente precisos. Esto requiere que el instrumento usado para realizar la medición (como por ejemplo una prueba o examen a estudiantes) sea confiable. Por ejemplo, una pistola es por completo confiable si siempre da en el blanco al ser apuntada exactamente en la misma dirección. En otras palabras, si la bala que dispara siempre da en el punto al cual se apunta la pistola. O sea, que si la pistola no da en el blanco es porque la persona que la disparó falló, o sea, no apuntó correctamente.
Una medición es “válida” si mide lo que en realidad trata de medir. Por ejemplo, una prueba de matemática no es válida para medir el rendimiento de alfabetización de los estudiantes. Tampoco sería válida una prueba culturalmente sesgada. En el caso de la pistola, si ésta no es apuntada en la dirección del blanco, sino que fuera de él, simplemente jamás dará en el blanco, por muy confiable que sea.
El problema de la validez, entonces, consiste asegurarnos de que estamos midiendo lo que deseamos medir o, de acuerdo con nuestro ejemplo, que estamos apuntando en la dirección correcta. El problema de la confiabilidad, en cambio, se resuelve utilizando un instrumento preciso (una pistola en perfecto estado).
Observe que la confiabilidad es una condición necesaria, pero no suficiente para la validez. Así, para tener confianza de que vamos a dar en el blanco necesitamos una pistola en perfecto estado, pero esto no es suficiente: además necesitamos apuntar al blanco y no fuera de él. Podemos medir con precisión, pero si medimos el objeto incorrecto, la información obtenida no será válida para describir o explicar la población.
Toda medición o instrumento de recolección de los datos debe reunir dos requisitos esenciales: confiabilidad y validez. La confiabilidad de un instrumento de medición se refiere al grado en que su aplicación repetida al mismo sujeto u objeto, produce iguales resultados. Por ejemplo, si yo midiera en este momento la temperatura ambiental mediante un termómetro y me indicara que hay 220C. Un minuto más tarde consultara otra vez y el termómetro me indicara que hay 50C. Tres minutos después observara el termómetro y ahora me indicara que hay 400C. Este termómetro no sería confiable (su aplicación repetida produce resultados distintos). Igualmente, si una prueba de inteligencia la aplico hoy a un grupo de personas y me proporciona ciertos valores de inteligencia; la aplico un mes después y me proporciona valores diferentes, al igual que en subsecuentes mediciones. Esa prueba no es confiable (analícense los valores de la figura siguiente, suponiendo que los coeficientes de inteligencia puedan oscilar entre 95 y 150). Los resultados no son consistentes; no se puede “confiar” en ellos.
EJEMPLO DE RESULTADOS PROPORCIONADOS POR
UN INSTRUMENTO DE MEDICIÓN SIN CONFIABILIDAD
PRIMERA SEGUNDA TERCERA
APLICACIÓN APLICACIÓN APLICACIÓN
Martha 130 Laura 131 Luis 140
Laura 125 Luis 130 Teresa 129
Arturo 118 Marco 127 Martha 124
Luis 112 Arturo 120 Rosa María 120
Marco 110 Chester 118 Laura 109
Rosa Maria 110 Teresa 118 Chester 108
Chester 108 Martha 115 Arturo 103
Teresa 107 Rosa María 107 Marco 101
La confiabilidad de un instrumento de medición se determina mediante diversas técnicas.
La validez, en términos generales, se refiere al grado en que un instrumento realmente mide la variable que pretende medir. Por ejemplo, un instrumento valido para medir la inteligencia,debe medir la inteligencia y no la memoria. Una prueba sobre conocimientos de Historia debe medir esto y no conocimientos de literatura histórica. Aparentemente es sencillo lograr la validez. Después de todo —como dijo un estudiante— “pensamos en la variable y vemos cómo hacer preguntas sobre esa variable”. Esto seria factible en unos cuantos casos (como lo sería el “sexo” de una persona). Sin embargo, la situación no es tan simple cuando se trata de variables como la motivación, la calidad de servicio a los clientes, la actitud hacia un candidato político y menos aun con sentimientos y emociones, así como diversas variables con las que trabajamos en ciencias sociales. La validez es una cuestión más compleja que debe alcanzarse en todo instrumento de medición que se aplica. Kerlinger (1979, p. 138) plantea la siguiente pregunta respecto a la validez: ¿Está usted midiendo lo que usted cree que está midiendo? Si es así, su medida es válida; si no, no lo es.
La validez es un concepto del cual pueden tenerse diferentes tipos de evidencia 1) evidencia relacionada con el contenido, 2) evidencia relacionada con el criterio y 3) evidencia relacionada con el constructo.
1) Evidencia relacionada con el contenido
La validez de contenido se refiere al grado en que un instrumento refleja un dominio específico de contenido de lo que se mide. Es el grado en que la medición representa al concepto medido (Bohrnstedt, 1976). Por ejemplo, una prueba de operaciones aritméticas no tendrá validez de contenido si incluye sólo problemas de resta y excluye problemas de suma, multiplicación o división (Carmines y Zeller, 1979). 0 bien, una prueba de conocimientos sobre las canciones de “Los Beatles” no deberá basarse solamente en sus álbumes Tet it Be”y “Abbey Road”, sino que debe incluir canciones de todos sus discos.
Un instrumento de medición debe contener representados a todos los items del dominio de contenido de las variables a medir.
2) Evidencia relacionada con el criterio
La validez de criterio establece la validez de un instrumento de medición comparán¬dola con algún criterio externo. Este criterio es un estándar con el que se juzga la validez del instrumento (Wiersma, 1986). Entre los resultados del instrumento de medición se relacionen más al criterio, la validez del criterio será mayor. Por ejemplo, un investigador valida un examen sobre manejo de aviones, mostrando la exacti¬tud con que el examen predice qué tan bien Un grupo de pilotos puede operar un aeroplano.
Si el criterio se fija en el presente, se habla de validez concurrente(los resultados del instrumento se correlacionan con el criterio en el mismo momento o punto del tiempo). Por ejemplo, un cuestionario para detectar las preferencias del electorado por los distintos partidos contendientes, puede validarse aplicándolo tres o cuatro días antes de la elección y sus resultados compararlos con los resultados finales de la elección (si no hay fraude —desde luego—).
Si el criterio se fija en el futuro, se habla de validez predicativa. Por ejemplo, una prueba para determinar la capacidad administrativa de altos ejecutivos se puede validar comparando sus resultados con el futuro desempeño de los ejecutivos medidos.
3) Evidencia relacionada con el constructo
La validez de constructo es probablemente la más importante sobre todo desde una perspectiva científica y se refiere al grado en que una medición se relaciona consis¬tentemente con otras mediciones de acuerdo con hipótesis derivadas teóricamente y que conciernen a los conceptos (o constructos) que están siendo medidos. Un cons¬tructo es una variable medida y que tiene lugar dentro de una teoría o esquema teórico.
Por ejemplo, supongamos que un investigador desea evaluar la validez de constructo de una medición particular, digamos una escala de motivación intrínseca: “el Cuestionario de Reacción a Tareas”, versión mexicana (Hernández-Sampieri y Cortés, 1982). Estos autores sostienen que el nivel de motivación intrínseca hacia una tarea está relacionado positivamente con el grado de persistencia adicional en el desarrollo de la tarea (v.g., los empleados con mayor motivación intrínseca son los que suelen quedarse más tiempo adicional una vez que concluye su jornada). Conse¬cuentemente, la predicción teórica es que a mayor motivación intrínseca, mayor persistencia adicional en la tarea. El investigador administra dicho cuestionario de motivación intrínseca a un grupo de trabajadores y también determina su persistencia adicional en el trabajo. Ambas mediciones son correlacionadas. Si la correlación es positiva y sustancial, se aporta evidencia para la validez de constructo del Cuestionario de Reacción a Tareas, versión mexicana (a la validez para medir la motivación intrínseca).
La validez de constructo incluye tres etapas:
1) Se establece y especifica la relación teórica entre los conceptos (sobre la base del marco teórico).
2)
...