Refuerzo positivo o entrenamiento en recompensa
Maria Belen VasquezDocumentos de Investigación10 de Enero de 2018
3.242 Palabras (13 Páginas)197 Visitas
[pic 1]
UNIVERSIDAD DE LAS AMERICAS
Escuela de Psicología
Psicología
Psicología del Aprendizaje
Tercer semestre 2017-2018
María Belén Vásquez Vicuña
722651
Sofía Torres Zambrano
[pic 2]
Quito ,15 de diciembre del 2017
Índice
Índice 2
Tema 1 3
Introducción 3
Fundamentación teórica 3
Adquisición 4
Extinción 4
Refuerzo positivo o entrenamiento en recompensa 4
Refuerzo negativo 5
Castigo positivo 5
Castigo negativo 5
Conclusión 6
Reflexión personal 7
Introducción 7
Fundamentación teórica 8
Pensamiento representacional 8
Conceptos numéricos 8
Teorías intuitivas 9
Limitaciones del pensamiento pre operacional 9
Conclusión 11
Reflexión personal 12
Referencias 12
Tema 1
Introducción
Cuando un estimulo del ambiente predice otro estimulo relevante , su presentación incita una reacción condicionada.
Pero existe otra forma de aprendizaje en el cual la conducta es controlada por consecuencias. Este tipo de aprendizaje se le conoce como condicionamiento operante
( condicionamiento instrumental ), en el cual se trata de que el individuo realiza una conducta para conseguir algo que le interesa o para suprimir y evitar algo que le molesta, también puede suprimir una conducta para no ser castigado , es decir la conducta del individuo tiene un objetivo y se dirige a una meta.
Este tipo de aprendizaje es muy común en nuestras vidas , la mayor parte de o que hacemos obedece a las consecuencias de nuestras acciones. Vamos a estudiar al colegio para poder conseguir un titulo profesional , vamos al trabajo porque necesitamos un sueldo , pagamos las planillas básicas para que no nos quiten la luz , el agua ,etc. Lo mismo que un adiestrador de un perro cambia la conducta del animal mediante premios y castigos , nosotros los humanos educamos a los niños similar a eso , recompensamos aquellas acciones que queremos promover y castigamos aquellas otras que queremos quitar. En este trabajo estudiaremos mas a fondo como aprendemos a cambiar nuestra conducta en función de sus consecuencias.
Fundamentación teórica
El condicionamiento operante es una forma de un aprendizaje asociativo en la que el sujeto tiene una relación entre la conducta y sus consecuencias en presencia de un estímulo discriminativo que señala la posibilidad del refuerzo , es decir que el condicionamiento operante o instrumental consta de 3 elementos : la respuesta , el estímulo reforzador positivo o refuerzo negativo y el contexto donde ocurren estos sucesos o estímulo discriminativo. Esto consiste en retirara el refuerzo. Como consecuencia de ella interrumpe la relación R-E y se produce una discriminación progresiva de la fuerza de la respuesta. Es el fenómeno contrario a la adquisición. (Vicente, 2014)
Uno de los principios del condicionamiento
Adquisición
Es la emisión de una respuesta seguida de un estimulo reforzador que da lugar a la adquisición de una respuesta nueva o poco frecuente. El reforzamiento da una respuesta que produce una asociación entre la respuesta y el reforzador , esto aumenta la probabilidad de que la respuesta se repita. Entre mas emparejamientos tenga entre los dos elementos asociados mayor será la fuerza de esa asociación y mayor la fuerza de la respuesta . Para aprender una conducta inexistente o poco frecuente en el repertorio de un organismo, podemos esperar a que el sujeto haga la respuesta por casualidad o podemos entrenarle mediante la técnica del modelamiento. La primera técnica resulta poco efectiva, en cambio , el modelamiento se considera muy efectivo para aprender con rapidez. El modelamiento es la consecución gradual de una respuesta final o meta , se logra mediante el reforzamiento de las respuestas iniciales. Esto consiste en retirara el refuerzo. Como consecuencia de ella interrumpe la relación R-E y se produce una discriminación progresiva de la fuerza de la respuesta. Es el fenómeno contrario a la adquisición. (Vicente, pág. 168)
Extinción
Esto consiste en retirara el refuerzo. Como consecuencia de ella interrumpe la relación R-E y se produce una discriminación progresiva de la fuerza de la respuesta. Es el fenómeno contrario a la adquisición. (Vicente, pág. 169)
Refuerzo positivo o entrenamiento en recompensa
Un procedimiento en el cual hay una relación de contingencia positiva entre R y la consecuencia. La realización de la respuesta produce la presentación del refuerzo positivo y como resultados un aumento de la misma., la respuesta instrumental produce un estímulo apetitivo. Si se da la respuesta , el estímulo apetitivo se presenta y, por el contrario, si no se da la respuesta el estímulo apetitivo no se presenta existe una contingencia positiva entre la respuesta instrumental y el estímulo positivo o apetitivo. El reforzamiento positivo produce incremento en la tasa de respuesta. (Lozada, pág. 73)
Refuerzo negativo
Esto es (escape y evitación ) hay una relación de contingencia negativa entre la respuesta instrumental y la consecuencia. La ejecución de las respuestas interrumpe o impide que esto lleve acabo un estimulo aversivo. Puede ser dos tipos escape, y evitación. En el escape , el estímulo aversivo se presenta pero puede ser eliminado por la respuesta instrumental. La presencia de un estímulo establece la ocasión para la ocurrencia de una respuesta , entonces es reforzada por la terminación del estímulo aversivo. La evitación implica una programación de un estímulo aversivo para poder ser presentado en algún momento del futuro , en estos casos la respuesta instrumental previene la entrega del estímulo. Así , en los procedimientos de escape y evitación aumenta la fuerza de la respuesta. (Lozada, pág. 74)
Castigo positivo
La respuesta instrumental produce o aproxima un estímulo molesto o aversivo. Produce disminución en la respuesta instrumental.
Castigo negativo
Llamado también entrenamiento de omisión, el castigo negativo incluye una contingencia negativa entre la respuesta instrumental y un seceso ambiental. En estos casos la respuesta instrumental previene la presentación de un estímulo apetitivo o placentero. Reduce o extingue la futura emisión de la conducta.
Cuando se presenta después de una respuesta, algunos estímulos tales como el agua, comida, el contacto sexual, el dinero , la atención o los halagos aumenta la probabilidad futura de emisión de dicha respuesta y, en este caso, se dice que actúan como refuerzo positivo. (Lozada, pág. 74)
Existen cuatro tipos básicos de programas de reforzamiento: los programas de razón fija y variable, en los que la recompensa depende del numero de respuestas efectuadas por un sujeto , y los programas de intervalo fijo y variable, en los que la respuesta se refuerza solo cuando ha transcurrido cierto período de tiempo.
Evidencias
-Mi evidencia fue un video donde podemos ver que en el refuerzo positivo son el alimento de recibe la rata tras aplastar la palanca, el dinero que recibe un trabajador tras realizar una tarea que si el trabaja las 8 horas completas sabe que recibirá un dinero y por el cual no se ira antes de cumplir las 8 horas porque sabe que si cumple le pagaran bien, es algo que recibe un individuo tras emitir un conducta socialmente esperada. La consecuencia obtenida produce el aumento futuro de la probabilidad de aparición de dicha conducta.
- Refuerzo negativo son el consumo de pastillas que alivia un dolor , es algo que nos ayuda pero sabe que si le duele algo tiene que tomarse una pastilla que sabe que con el tiempo tomar tantas pastillas le puede afectar a otra parte del cuerpo.
-Castigo positivo son la descarga eléctrica recibida al tocar un enchufe o las habladas recibidas por no hacer las tareas a tiempo , es algo que no hacemos y sabemos que nos van a regañar o darnos un castigo por el echo de no hacer caso
-La evidencia que saque es cuando mi papa se paso el limite de velocidad y ahí pude ver el castigo negativo son las multas de trafico: la conducta de conducir a mas velocidad de la permitida nos conlleva una consecuencia de perdida de dinero o la meno ración de puntos en nuestra licencia.
...