EL CONDICIONAMIENTO OPERANTE DE SKINNER.
YamielthEnsayo19 de Julio de 2016
3.445 Palabras (14 Páginas)881 Visitas
Skinner propuso una formación de la conducta originada a partir de observaciones del comportamiento en un experimento que ideo (la caja de Skinner. El investigador creía que está en esta situación podría examinarse y revelarse muchos de los conceptos importantes del control de la conducta. Skinner aislaba algunos fenómenos sumamente repetibles en el condicionamiento, y los utilizaba como base para aquellos conceptos empleados en el análisis de formas más complejas de conducta.
Skinner rechaza los “constructos teóricos” por innecesarios. Desecha una versión de estimulo-respuesta del conductismo y del asociacionismo, y más bien se dedica a los análisis informales o los análisis experimentales de varias conductas complejas, como la lectura.
CONDUCTA RESPONDIENTE Y OPERANTE
La diferencia esencial entre el sistema de Skinner y a psicología tradicional del E-R radica en la distinción entre la conducta respondiente y la conducta operante.
La mayor parte de la conducta humana es de naturaleza operante. Aunque Skinner es conductista, no es un psicólogo E-R. Su noción de la operante se refiere a la conducta que manifiestamente no es provocada por ningún estimulo, sino que es emitida.
Dos tipos de condicionamiento.
Se afirma que hay 2 tipos de respuesta relacionados con los tipos de condicionamiento, y que el condicionamiento de la conducta respondiente es del “tipo E”, porque el reforzamiento está correlacionado con los estímulos. El estimulo condicionado se presenta junto con el estimulo incondicionado.
Las leyes del condicionamiento operante son similares a las de condicionamiento clásico, ambas incluyen una ley del condicionamiento y una de la extinción.
Reforzadores primarios positivos y negativos
El reforzador positivo ocurre cuando un estimulo presentado a continuación de una respuesta operante fortalece la probabilidad de esa respuesta.
El reforzador negativo se produce cuando la eliminación de un estimulo aversivo después de una respuesta operante fortalece la probabilidad de esa respuesta. Skinner reconocía a los reforzadores condicionados basados en el pareamiento de estímulos neutrales con reforzadores primarios.
ESTUDIOS ACERDA DEL CONDICIONAMIENTO OPERANTE
Skinner opinaba que la adquisición de esta operante simple, ocurriría en un ensayo o instantáneamente, si se eliminaban los factores extraños y se el animal estuviera preparado de forma adecuada para un ensayo.
Así como el reforzamiento que ocurre para una operante la fortalece, se afirma que el no reforzamiento después de la respuesta la debilita, y una seria prolongada de respuestas no reforzadas da lugar a la gradual disminución de la tasa de respuestas mediante el proceso denominado de extinción experimental.
En 1950 comprendió, que podemos entrenar diferencialmente a un organismo ya sea a resistir o a desistir rápidamente en extinción, lo cual depende de la manera en que se programen las recompensas y las no recompensas durante el entrenamiento.
DISCRIMINACIÓN DE ESTÍMULOS Y RESPUESTAS
En términos conductuales, se dice que un organismo discrimina entre dos o más estímulos cuando aprende a responder diferencialmente a cada uno de los estímulos. Skinner se refiere a este fenómeno como control de estímulos, ya que la presentación o eliminación de un estimulo discriminativo dado controla la ocurrencia de un patrón particular de respuestas o de su tasa. Un segundo tipo de aprendizaje es la diferenciación de la respuesta, en la cual la forma de la respuesta o su intensidad, amplitud o latencia se alteran mediante el reforzamiento diferencial.
Discriminación de estímulos
Para ilustrar el punto de vista de Skinner, el experimento estándar de opresión de palanca sirve para descubrir los propósitos del condicionamiento discriminatorio. La discriminación de logra al extinguir las respuestas generalizadas a los estímulos no reforzados.
Terrace, un discípulo de Skinner demostró que es posible lograr una discriminación perfecta sin la ocurrencia de una sola respuesta no reforzada al E-.
Terrace demostró que una discriminación aprendida sin errores, podía trasferise a nuevos estímulos mediante un método especial. Esto sugiere que si ha de entrenarse una discriminación difícil, un método oprimo consiste en entrenar sin errores otra disciplina que por si sea sencilla para el sujeto, y entonces superponer y desvanecer los estímulos más difíciles.
La discriminación sin errores es posible usando el principio del cambio de asociación de Thordike, que en este caso es el mismo que el condicionamiento de Guthrie, mediante la simple contigüidad de la última respuesta dada antes de que termine un estímulo.
Rilling argumenta que un error es una parte arbitrariamente definida de una cadena completa de respuestas y que las partes iniciales de la cadena pueden ocurrir regularmente al E- sin que se registren. Sostiene que no deberíamos asignarle una importancia tal a los errores registrados. Para Rilling no hay una razón que justifique la acentuada distinción cualitativa entre el aprendizaje propenso al error y el aprendizaje sin errores.
Diferenciación de una respuesta:
Moldeamiento
La diferenciación de respuestas se refiere al reforzamiento de ciertas propiedades de una respuesta, como su velocidad, duración o vigor.
Otro tipo de moldeamiento ocurre cuando una nueva respuesta cualitativa o de secuencia novedosa de componentes conductuales se ensambla en una ejecución unitaria. Aquí se usa la noción del encadenamiento, que se desempeño un papel importante en los análisis de Skinner.
Cadenas de respuestas.
Skinner sostiene que muchos actos con una secuencia de movimientos en los que cada segmento proporciona estímulos de retroalimentación, que se vuelven discriminativos para el siguiente segmento de la respuesta.
Este análisis del encadenamiento sugiere no solo las leyes para descomponer cadenas establecidas, sino también un medio de entrenar al organismo en nuevas cadenas, al vincular nuevas secuencias de componentes conductuales para crear collares de diseños nuevos.
PROGRAMAS DE REFORZAMIENTO
En la vida cotidiana el reforzamiento de la conducta operante no sólo es regular y uniforme El problema del mantenimiento o del fortalecimiento de la respuesta mediante el reforzamiento internamente es algo más que una mera curiosidad de laboratorio. Skinner explorador exhaustivamente Dos clases principales de reforzamiento intermitente denominados ahora programas de intervalo y programas de razón.
Los programas de intervalo fijo se reflejan con la ayuda de un reloj el reforzamiento se proporciona a la primera respuesta que ocurre después de un intervalo significado que se mide a partir del reforzamiento procedente o desde el inicio de un estímulo de ensayo. La otra clase importante de programa de reforzamiento de razón fija en el reforzamiento se proporciona después de un número predeterminado la respuesta a continuación del reforzador procedente.
Las respuestas en los programas de razón tienden a ser muy rápido ya que cuando más rápido contesta el animal con mayor gratitud consigue la recompensa. La pausa post reforzamiento es más prolongada Con razón es más grande el afectan muchas variables mientras que la tasa de respuestas terminal parece relativamente fija e Insensible a tales variables. Skinner compara la pausa postre forzamiento con la abulia la incapacidad de gastar esfuerzo. Una analogía sería la del estudiante que termina en la composición del examen trimestral tal vez en un tren la velocidad a medida que se acerca la fecha de entrega y resulta difícil comenzar a trabajar en una nueva tarea.
Las posibles variaciones en los programas de reforzamiento son casi ilimitadas la recompensa puede programarse de acuerdo con el paso del tiempo el número de respuestas o alguna combinación de ambos los programas buen disponerse en secuencias con inicios asociados o sin ellos etcétera.
En el programa de reforzamiento diferencial de tasas bajas de respuestas por ejemplo en 10 segundos la respuesta se reforzará sólo si ha transcurrido al menos 10 segundos desde la última respuesta si la respuesta se produce demasiado pronto el cronómetro pone nuevamente en marcha y debe medir otra espera de por lo menos 10 segundos antes del tiempo de respuesta recompensa. Los programas RDB generan conducta al tiempo.
El análisis de la ejecución RDB trata el tiempo entre respuesta sucesivas como unidades de análisis cómo lo hacen Logan en su teoría micro molar supone que la mayoría de los programas ponen un contrato o función de términos que relacionan las diferentes probabilidades de reforzamiento para los distintos tiempos entre respuestas.
Reforzamiento condicionado
Un estímulo que originalmente no es reforzarte puede hacerse reforzarte mediante la asociación repetida con otro que sí lo es. el condicionamiento un estímulo adquiere el poder de actuar como reforzador lo cual a menudo se designa con expresiones reforzamiento secundario o recompensa adquirida.
Un estímulo que ocasiona un reforzamiento o lo acompaña adquiere de allí en adelante valor reforzante propia y se le puede llamar reforzamiento secundario condicionado o derivado. Un reforzador secundario puede extinguirse Cuándo se aplica reiteradas veces a una respuesta para la cual no hay reforzamiento primario último. Reforzamiento secundario expositivos y la fuerza mental con el cual se correlación a es positivo y negativo cuando el segundo también lo es.
Una vez establecido un reforzamiento secundario es independiente y no especificó fortalecerá a la misma respuesta qué producía al reforzamiento original sino que también condicionar a una respuesta nueva y no relacionada además producirá esos efectos Incluso en presencia de un motivo distinto. Mediante la generalización además de todo relacionado con el reforzamiento muchos estímulos a tienen valor reforzante positivo o negativo.
...