DESDE LOS TEST HASTA LA INVESTIGACION EVALUATIVA ACTUAL. UN SIGLO, EN EL XX DESARROLLO DE LA EVALUACION EN EDUCACION
ednaverenice13 de Marzo de 2014
4.092 Palabras (17 Páginas)623 Visitas
DESDE LOS TEST HASTA LA INVESTIGACION EVALUATIVA ACTUAL. UN SIGLO, EN EL XX DESARROLLO DE LA EVALUACION EN EDUCACION
1. Precedentes: Antes de los «tests» y de la medición
Desde la antigüedad se han venido creando y usando procedimientos instructivos en los que los profesores utilizaban referentes implícitos, sin una teoría explícita de eva¬luación, para valorar y, sobre todo, diferenciar y seleccionar a estudiantes. Dubois (1970) y Coffman (1971) citan los procedimientos que se empleaban en la China impe¬rial, hace más de tres mil años, para seleccionar a los altos funcionarios. Otros autores como Sundbery (1977) hablan de pasajes evaluadores en la Biblia, mientras Blanco (1994) se refiere a los exámenes de los profesores griegos y romanos. Pero según McReynold (1975), el tratado más importante de evaluación de la antigüedad es el Tetrabiblos, que se atribuye a Ptolomeo..
En el Renacimiento se siguen utilizando procedimientos selectivos y Huarte de San Juan, en su Examen de ingenios para las ciencias, defiende la observación como procedi¬miento básico de la evaluación (Rodríguez y otros, 1995).
En el siglo XVIII, a medida que aumenta la demanda y el acceso a la educación, se acentúa la necesidad de comprobación de los méritos individuales y las instituciones educativas van elaborando e introduciendo normas sobre la utilización de exámenes escritos (Gil, 1992).
Entrado el siglo XIX se establecen los sistemas nacionales de educación y aparecen los diplomas de graduación, tras la superación de exámenes (exámenes del Estado). Según Max Weber (Barbier, 1993), surge un sistema de exámenes de comprobación de una preparación específica, para satisfacer las necesidades de una nueva sociedad jerárquica y burocratizada.
2. Los tests psicométricos
En el contexto anterior, a finales del siglo XIX, se despierta un gran interés por la medición científica de las conductas humanas. Esto es algo que se enmarca en el movimiento renovador de la metodología de las ciencias humanas, al asumir el positivismo de las ciencias físico-naturales. En este sentido, la evaluación recibe las mismas influencias que otras disciplinas pedagógicas relacionadas con procesos de medición, como la pedagogía experimental y la diferencial (Cabrera, 1986).
Consecuentemente con este estado de cosas, en este periodo entre finales del siglo XIX y principios del XX, se desarrolla una actividad evaluativa intensa conocida como «testing», que se define por características como las siguientes:
• Medición y evaluación resultaban términos intercambiables. En la práctica sólo se hablaba de medición.
• El objetivo era detectar y establecer diferencias individuales, dentro del modelo del rasgo y atributo que caracterizaba las elaboraciones psicológicas de la época (Fernández Ballesteros, 1981), es decir, el hallazgo de puntuaciones diferenciales, para determinar la posición relativa del sujeto dentro de la norma grupal.
• Los tests de rendimiento, sinónimo de evaluación educativa, se elaboraban para establecer discriminaciones individuales, olvidándose en gran medida la representatividad y congruencia con los objetivos educativos. En palabras de Guba y Lincoln (1982), la evaluación y la medida tenían poca relación con los progra¬mas escolares. Los tests informaban algo sobre los alumnos, pero no de los programas con los que se les había formado.
Sin embargo, fue en los tests psicológicos donde los esfuerzos tuvieron mayor impacto, siendo probablemente la obra de Thorndike (1904) la de mayor influencia en los comienzos del siglo XX. En Francia desta¬can los trabajos de Alfred Binet, después revisados por Terman en la Universidad de Stanford, sobre tests de capacidades cognitivas. Ahora hablamos del Stanford-Binet, uno de los tests más conocidos en la historia de la psicometría.
Años más tarde, con las necesidades de reclutamiento en la Primera Guerra Mundial, Arthur Otis dirige un equipo que construye tests colectivos de inteligencia general (Alfa para lectoescritores y Beta para analfabetos) e inventarios de personalidad (Phillips, 1974).
Tras la contienda, los tests psicológicos se ponen al servicio de fines sociales. La década entre 1920 y 1930 marca el punto más alto del «testing», pues se idean multitud de tests estandarizados para medir toda clase de destrezas escolares con referentes objetivos externos y explícitos, basados en procedimientos de medida de la inteligencia, para utilizar con grandes colectivos de estudiantes.
3. El nacimiento de la verdadera evaluación educativa: La gran reforma «tyleriana»
La evaluación se dejaba, en último término, en manos de una interpretación totalmente personal del profesor. Como solución se proponía: a) elaboración de taxonomías para formular objetivos, b) diversificación de fuentes de información, exámenes, expedientes académicos, técnicas de repesca y tests, c) unificación de criterios de corrección a partir del acuerdo entre los correctores de las pruebas y d) revisión de los juicios de valoración mediante procedimientos tales como la doble corrección, o la media de distintos correctores. Como puede verse, se trata de criterios en buena medida vigentes actualmente y, en algún caso, incluso avanzados.
Esta evaluación ya no es una simple medición, porque supone un juicio de valor sobre la información recogida. Se alude, aunque sin desarrollar, a la toma de decisiones sobre los aciertos o fracasos de la programación, en función de los resultados de los alumnos, algo que retomarán otros importantes evaluadores como Cronbach y Sufflebeam unos años después.
Para Tyler, la referencia central en la evaluación son los objetivos preestablecidos, que deben ser cuidadosamente definidos en términos de conducta (Mager, 1962), teniendo en cuenta que deben marcar el desarrollo individual del alumno, pero dentro de un proceso socializador.
Tras la Segunda Guerra Mundial se produce un periodo de expansión y optimismo que Stufflebeam y Shinkfield (1987) no han dudado en calificar de «irresponsabilidad social», por el gran despilfarro consumista tras una época de recesión. Se trata de la etapa conocida como la de la inocencia (Madaus y otros, 1991). Se extienden mucho las instituciones y servicios educativos de todo tipo, se producen cantidad de tests estandarizados, se avanza en la tecnología de la medición y en los principios estadísticos del diseño experimental (Gulliksen, 1950; Lindquist, 1953; Walberg y Haertel, 1990) y aparecen las fa¬mosas taxonomías de los objetivos educativos (Bloom y otros, 1956; Krathwohl y otros, 1964). El verdadero desarrollo de las propuestas tylerianas vino después (Taba, 1962; Popham y Baker, 1970; Fernández de Castro, 1973).
4. El desarrollo de los sesenta
Los años sesenta traerán nuevos aires a la evaluación educativa, entre otras cosas porque se empezó a prestar interés por algunas de las llamadas de atención de Tyler, relacionadas con la eficacia de los programas y el valor intrínseco de la evaluación para la mejora de la educación.
En esa época surge un cierto conflicto entre la sociedad americana y su sis¬tema educativo, sobre todo porque los rusos iban por delante en la carrera especial, tras el lanzamiento del Sputnik por la URSS en 1957. Aparece un cierto desencanto con la escuela pública y crece la presión por la rendición de cuentas (MacDonald, 1976; Stenhouse, 1984). En 1958 se promulga una nueva ley de defensa educativa que proporciona muchos programas y medios para evaluarlos. En 1964 se establece el Acta de educación primaria y secundaria (ESEA) y se crea el National Study Comitte on Evaluation.
Para mejorar la situación y retomar la hegemonía científica y educativa, fueron mu¬chos los millones de dólares que desde los fondos públicos se destinaron a subvencionar nuevos programas educativos e iniciativas del personal de las escuelas públicas americanas encaminadas a mejorar la calidad de la enseñanza. (Popham, 1983; Rutman y Mowbray, 1983; Weiss, 1983
Buena parte de culpa de este fuerte ímpetu evaluador americano se debió a la ya citada aprobación de la «Elementary and Secondary Act» (ESEA) en 1965 (Berk, 1981; Rutman, 1984).
A finales de los años sesenta, y como consecuencia de lo anterior, entra en escena un nuevo movimiento, la era de la «Accountability», de la rendición de cuentas (Popham, 1980 y 1983; Rutman y Mowbray, 1983), que se asocia fundamentalmente a la responsabilidad del personal docente en el logro de objetivos educativos establecidos.
Otra dimensión de la responsabilidad escolar nos la ofrece Popham (1980), cuando se refiere al movimiento de descentralización escolar durante los últimos años sesenta y principios de los setenta. Los grandes distritos escolares se dividieron en áreas geográficas más pequeñas, y, por consiguiente, con un control ciudadano más directo sobre lo que ocurría en las escuelas.
Como hitos de la época hay que destacar dos ensayos por su decisiva influencia: el artículo de Cronbach (1963), Course improvement through evaluation, y el de Scriven (1967), The methodology of evaluation. La riqueza de ideas evaluativas expuestas en estos trabajos nos obligan a que, aunque brevemente, nos refiramos a ellas.
Stake (1967) propuso su modelo de evaluación, The countenance model, que sigue la línea de Tyler, pero es más completo al considerar las discrepancias entre lo observado y lo esperado en los «antecedentes» y «transacciones», y posibilitar algunas bases para elaborar hipótesis acerca de las causas y los fallos en los resultados finales. En sus sucesivas propuestas, Stake se irá distanciando de sus posiciones iniciales.
Metfessell
...