Teoria Conductista del Aprendizaje de Ivan Pavlov y Edward Thorndike


La teoría conductista se basa en las teorías de Ivan P. Pavlov (1849-1936). Se centra en el estudio de la conducta observable para controlarla y predecirla. Su objetivo es conseguir una conducta determinada. 
Condicionamiento Clásico: es cuando un organismo aprende a responder a un estímulo neutro que normalmente evoca una respuesta.
Para demostrarlo y analizarlo, Pavlov condujo una serie de experimentos, en uno de ellos media la cantidad de salivación de un perro, después de sonar un diapasón y, segundos después, le mostraba carne molida a un perro. Este apareamiento, planeado en forma cuidadosa lo realizo en repetidas ocasiones, al principio el perro sólo salivaba al presentarle la carne molida, pero pronto comenzó a salivar con sólo en sonido del diapasón, se había logrado un condicionamiento clásico en el perro para que salivara al escuchar el diapasón.


Resultado de imagen para Conductista del Aprendizaje de Ivan Pavlov y Edward Thorndike
Antes del condicionamiento, tenemos dos estímulos no relacionados: el sonido del diapasón y la carne molida. Sabemos que el sonido del diapasón no conduce a la salivación, si no a una respuesta irrelevante como levantar las orejas o, tal vez una reacción sorpresa, por ello el sonido en este caso se denomina Estímulo Neutro, puesto que no tiene efecto sobre la respuesta de interés.
Los conductistas definen el aprendizaje como la adquisición de nuevas conductas o comportamientos.
En este proceso de condicionamiento intervienen factores clave:
·         El estímulo incondicionado (EI), que viene siendo aquel que produce invariablemente una reacción, estímulo que produce una respuesta sin que se haya aprendido. (en este caso, la comida, carne molida). debido que todo alimento que coloca en el hocico de un perro causa inmediatamente una salivación.
·         La respuesta incondicionada (RI), que es provocada por el estímulo incondicionado, respuesta que no está asociada con un aprendizaje previo, son respuestas innatas, que no implican entrenamiento alguno la (salivación ante el olor del alimento)
·         El estímulo condicionado (EC), que se considera neutro porque no produce ninguna respuesta al menos que se haya dado el pareamiento (la campana).
·         La respuesta condicionada (RC), que es el resultado de mezclar el estímulo incondicionado y el estímulo condicionado (comida + campana = salivación al escuchar la campana).
Aplicación de los principios del condicionamiento al comportamiento humano
Pronto se descubrió que los principios del condicionamiento clásico explican muchos aspectos del comportamiento humano cotidiano. Por ejemplo, cómo las personas pueden experimentar retortijones de hambre al ver el logotipo de un restaurante de hamburguesa, la causa de esta reacción es el condicionamiento clásico: el logotipo previamente neutro ha llegado asociarse con la comida que se vende en el lugar (estímulo incondicionado), lo que provoca que dicho logotipo se convierte en el estímulo condicionado que trae consigo la respuesta condicionada de hambre
Extinción: el aprendizaje de lo que hemos aprendido
¿Qué cree que sucedería si un perro, que ha sido entrenado con condicionamiento clásico para salivar antes en sonido de una campana, no vuelve a recibir nuca alimento cuando esta suena? La respuesta se encuentra en uno de los fenómenos básicos del aprendizaje: la Extinción, que tiene lugar cuando disminuye la frecuencia de una respuesta previamente condicionada, hasta que, por último, desaparece.
En resumen, la extinción se produce cuando el estímulo condicionado se presenta repetidas veces sin el estímulo incondicionado. Debemos considerar que la extinción puede ser un fenómeno útil.
Recuperación espontánea: el retorno de la respuesta condicionada
Recuperación espontánea, es decir, la reaparición de una respuesta previamente extinguida después de que ha pasado tiempo sin exposición de un estímulo condicionado, no obstante, la respuesta que reaparecen por vía de la recuperación espontánea suele ser más débiles que la iniciales, por lo cual se puede extinguir con mayor facilidad.
Generalización y discriminación
Pavlov se percató de la existencia de un fenómeno análogo, a menudo, su perro no sólo salivaba ante el sonido del diapasón que se había empleado en su condicionamiento original, sino también ante una campana.
Semejante comportamiento es el resultado de la generalización de estímulos, que tiene lugar cuando la respuesta condicionada, se produce ante un estímulo similar al estímulo condicionado original. Mientras mayor sea el parecido entre ambos estímulos, mayor será la probabilidad de que se produzca una generalización de estímulos.
La discriminación de estímulos: en esta, el organismo aprende a diferenciar distintos estímulos y restringir la respuesta condicionada a uno solo, en lugar de responder a todos. Si no tuviéramos la capacidad para discriminar entre las luces, verde y la roja de un semáforo, el tráfico de las calles nos arrollaría, y no fuéramos capaces de distinguir a un gato de un puma, nos encontraríamos en una difícil situación cuando estuviéramos en el campamento en las montañas.
Condicionamiento de orden superior
El condicionamiento de orden superior se produce cuando un estímulo condicionado que se ha establecido durante un condicionamiento previo se relaciona repetidamente con un estímulo neutro. Si este último, por sí mismo llega a provocar una respuesta condicionada parecida a la del estímulo condicionado original, se habrá producido un condicionamiento de orden superior.
Condicionamiento Operante: describe el aprendizaje en el que una persona se fortalece o debilita, según sus consecuencias sean positivas o negativas a diferencia del condicionamiento clásico, en que los comportamientos originales son las respuestas biológicas naturales ante la presencia de los estímulos como alimento, agua o dolor.
Ley del efecto de Thorndike:


Resultado de imagen para Ley del efecto de Thorndike:
La idea fundamental que expresa la Ley del Efecto es que, si una consecuencia percibida como positiva (y por tanto, satisfactoria) ocurre justo después de una acción, es más posible que esa misma acción vuelva a producirse. En cambio, si después de una acción llega un estímulo desagradable o doloroso, las posibilidades de repetir esa acción disminuirían.
Por otro lado, esta ley fue propuesta tanto para describir el comportamiento animal como el de los seres humanos. Una de las características del conductismo, que Thorndike ayudó a inaugurar, era que al restar importancia o incluso negar la funcionalidad de la consciencia en los actos sus esquemas podían ser aplicados a muchas formas de vida, prácticamente todas aquellas capaces de aprender: ratones, moluscos, etc.
Reforzamiento del comportamiento deseable
Reforzamiento, es el proceso por el que el estímulo incrementa la probabilidad de repetir un comportamiento precedente, en otras palabras, es más probable que ocurran de nuevo los picotazos debido al estímulo del alimento.
¿Qué clase de estímulo puede actuar como reforzador?
Los Premios, los juguetes y las buenas calificaciones pueden servir como reforzadores, si fortalecen una respuesta que se da antes de su introducción. En cada caso es importante que el organismo aprenda que la aparición de un reforzador es contingente con la ocurrencia de la respuesta en primer lugar, este hecho sugiere que pueda establecer una distinción entre reforzadores primarios y secundarios.
Un reforzador primario, satisface alguna necesidad biológica y funciona de modo natural, independientemente de la experiencia previa de la persona.
En contraste, un reforzador secundario es un estímulo que funciona como reforzador como consecuencia de su asociación con un reforzador primario. Por ejemplo, sabemos que el dinero es valioso, debido a que hemos aprendido que nos permite obtener otros objetos deseables, incluyendo reforzadores primarios, como la comida, el abrigo.
Reforzadores positivos, negativos y castigos
Un reforzador positivo, es un estímulo que se añade al entorno y que trae consigo un incremento de respuesta precedente. Si se otorga alimento, agua, dinero o elogio después de una respuesta, es más probable que esta se repita en el futuro.
En contraste, un reforzador negativo se refiere a la eliminación en el ambiente de un estímulo desagradable, la cual conduce de un aumento de probabilidad de que la respuesta precedente ocurra de nuevo en el futuro. Por ejemplo, aumenta si tiene síntomas de resfrío (estímulo desagradable) que se elimina al ingerir una medicina, es más probable que la tome la próxima vez que experimente estos síntomas.
El reforzamiento negativo ocurre en dos tipos de aprendizaje:
El condicionamiento de escape, el organismo aprende a dar respuesta que pone fin a una situación aversiva, por ejemplo, los niños no tardan mucho tiempo para aprender a alejar sus manos de un radiador caliente.
El condicionamiento por evitación, en contraste, tiene lugar cuando un organismo responde a una señal de que ocurra de manera inminente un suceso desagradable, de modo que se hace posible su evasión. Por ejemplo, una rata aprende con rapidez a accionar una palanca para evitar una descarga eléctrica que se da después de un sonido.
El castigo se refiere al estímulo desagradable o doloroso que disminuye la probabilidad de que ocurra de nuevo el comportamiento precedente. En contraste, al reforzador negativo se le asocia la remoción del estímulo desagradable o doloroso, lo cual produce un incremento en el comportamiento que puso fin al estímulo desagradable.
Programa de intervalo fijo y variable: el paso del tiempo
Los programas de reforzamiento son reglas que indican el momento y la forma en que la aparición de la respuesta va a ir seguida de un reforzador sobre la administración del reforzador. Estos programas influyen en distintos aspectos del aprendizaje, como la rapidez con la que se aprende inicialmente la respuesta, la frecuencia con la que se ejecuta la respuesta aprendida, la frecuencia con la que se hacen las pausas después de los reforzamientos, o el tiempo que se sigue ejecutando la respuesta una vez que el refuerzo deja de ser predecible o se suspende.
Existen dos tipos básicos de reforzamiento:
En el reforzamiento continuo cada una de las respuestas da lugar a la aparición de un reforzador, como en el caso de una paloma que recibe comida cada vez que picotea una tecla. Este tipo de reforzamiento parece ser el modo más eficaz para condicionar inicialmente la conducta. Sin embargo, cuando el refuerzo cesa la extinción también es rápida.
Por su parte, en el reforzamiento intermitente las respuestas solo se refuerzan algunas veces, como en el caso de una persona que juega a las máquinas y recibe el refuerzo o premio cada varias jugadas. Este tipo de programa produce un patrón más persistente de respuestas que un programa continuo cuando el reforzamiento se vuelve impredecible o cesa.
El reforzamiento intermitente da lugar a los programas de reforzamiento, que pueden ser de dos tipos: de razón (en función del número de respuestas) y de intervalo (en función del tiempo). A su vez, cada uno de ellos admite dos tipos de administración: fija o variable.
      Razón fija: El refuerzo se obtiene después de un número fijo de respuestas. Un ejemplo se da cuando las fábricas pagan a sus obreros después de producir un determinado número de productos.
  Razón variable: En este caso, el número de respuestas para conseguir el reforzador varía aleatoriamente, aunque siempre dentro de un promedio determinado. Un ejemplo son las máquinas tragamonedas, que están programadas para otorgar el premio conforme a un programa de razón variable.
      Intervalo fijo: El refuerzo aparece cada vez que transcurre una determinada cantidad de tiempo, siempre que durante el intervalo se haya dado la respuesta. Un ejemplo sería el de un padre que verifica cada media hora que su hijo está estudiando, y cuando es así le hace un halago.
      Intervalo variable: El refuerzo está disponible después de un tiempo que varía aleatoriamente, pero alrededor de un promedio. Un ejemplo es el de un profesor que realiza exámenes sorpresa aproximadamente cada semana.
Por lo general, los programas de tasa (razón) producen una adquisición más rápida, pero fácilmente extinguible una vez suspendida la administración de reforzadores; y los de intervalo producen una adquisición más estable y resistente a la extinción. En la vida real, estos programas básicos a menudo se combinan.



Comentarios