Network versus symbol systems: Two approaches to modeling cognition - Bechtel
María CastroResumen11 de Abril de 2016
3.051 Palabras (13 Páginas)268 Visitas
Connectionism and the Mind
Capítulo 1: Network versus symbol systems: Two approaches to modeling cognition - Bechtel:
1.1
Paradigma simbólico vs conexionismo (Los dos son teorías de sistemas computacionales, sin embargo la diferencia está en cuál es el significado de computacional) El simbólico trabaja con reglas específicas que no posee flexibilidad y no permite aprender.
Conexionismo: La cognición no se construye sombre la manipulación simbólica. La idea básica es que hay una red elemental de unidades o nodos, cada una tiene algún grado de activación. Estas unidades están conectadas entre sí, así que unidades activas excitan o inhiben otras unidades. La red es un sistema dinámico, que con el input inicial, esparce excitaciones e inhibiciones entre las unidades. Se enfoca en procesos causales en que las unidades excitan e inhiben unas a otras y no conforme a símbolos o reglas. Las redes neuronales trabajan a nivel paralelo y funcionan con retroalimentación (feedback) lo que permite detectar errores y desarrollar aprendizaje. Solo estas se basan en los procesos causales.
1.2
McCulloch y Pitts: “neuronas formales” que son unidades binarias. cada unidad recibe inputs excitatorios o inhibitorios.
Von Neumann: La red es más confiable si las unidades pueden recibir un mayor número de inputs, y su activación está determinada por un patrón estadístico sobre las unidades (umbral).
Winograd y Cowan: Una unidad puede contribuir a la decisión de activación de otras unidades, y a su vez ser afectada por otras unidades, de esta manera, no se tienen que aumentar de tal forma el n° de unidades.
Rosenblatt: “perceptron elemental” → una “capa” de unidades (McCulloch y Pitts) reciben inputs de unidades sensoriales. Cada unidad es influenciada de manera individual por los inputs, de forma inhibitoria o excitatoria, entre un rango de fuertemente inhibitorio o fuertemente excitatorio. Si la activación es suficiente, depende del umbral (threshold - t). Ronseblatt difiere de McCulloch y Pitts en hacer que los “pesos” (weights) de las conexiones sean continuas en vez de binarias, e introduciendo procedimientos que pueden cambiar los pesos, para que los perceptrones puedan aprender.
Oliver Selfridge: modelo pandemonium. Ejemplificó con el reconocimiento de letras: Demonio específico → identifican y gritan por las características de las letras. Demonios cognitivos → computan en forma paralela sin prestar atención uno a otro. gritan su interpretación de la letra. Cada uno de estos demonios está especializado en reconocer una letra en particular. Demonio de decisión → identifica la letra.
Una de las virtudes de este tipo de red es que aunque una de las características faltara, podría dar una respuesta correcta o cercana sobre la letra.
** Además de modelar procesos de patrones de reconocimiento, las redes pueden servir como modelos de establecimiento de la memoria (como veremos a continuación).
Donald Hebb: Cuando dos neuronas en el cerebro están activas conjuntamente, la fuerza de la conexión podría incrementarse. (algoritmo base del aprendizaje).
Wilfrid Taylor: Desarrolla la idea de Hebb formando redes análogas de unidades que toman activaciones en un rango continuo.
David Marr: El cerebelo es una red de este tipo, ya que puede ser entrenada por el cerebro para controlar movimientos voluntarios.
1.3 The allure of symbolic manipulation
1.3.1 De la lógica a la inteligencia artificial
Proposiciones verdaderas o falsas → Model theoretic perspective
La relación entre las proposiciones y las entidades que representan → proof theoretic persepctive
Estas dos perspectivas derivan a una idea muy importante, pero en parte falsa. Si la inteligencia dependiera del razonamiento lógico, en el que la meta es la preservación de la verdad, sería posible armar procedimientos formales de prueba que podrían simular la inteligencia. Sin embargo, la inteligencia no depende solamente de inferencias que mantienen la verdad. Es necesario a veces hacer uso de la lógica inductiva → establecer procedimientos que lleven a proposiciones que son verdaderas o probablemente verdaderas.
Como conclusión de este razonamiento, entenderemos que muchas veces la heurística es más eficiente a la hora de obtener el resultado deseado que un algoritmo.
Racionalistas → símobols como ideas
1.3.2 De la linguistica al procesamiento de información
Noam Chomsky y Jerry Fodor
1.3.3
En la ciencia cognitiva, se juntan ambas corrientes (lógica formal y linguistica) para diseñar prgramas de computador que sirven como model o simulación de la cognición humana.
Se enumeran las razones de resurgimiento del conexionismo en los ‘80.
1.4
1.4.1 Problemas de los perceptrones
Minsky y Papert critican que hay funciones que no pueden ser resueltas por estas redes (XOR function, McCulloch y Pitts responden que es necesario incluir unidades ocultas que procesan la información entre el input y output). Otra crítica consiste en que el único tipo de procesos cognitivos que las redes son capaces de resolver son aquellas que consisten en asociaciones.
1.4.2 Re-emergencia: El nuevo conexionismo
1980 → Rosenblatt
Se listan las razones del nuevo surgimietno del conexionismo, entre ellas: Innovaciones en arquitectura y diseño de las redes, nueva relación con la neurociencia (neuroimágen), limitaciones del model simbólico.
1.5
En los años recientes, no se han estrechado los lazos entre conexionismo y simbolismo, sin embargo, el conexionismo ha formado alianzas con otras teorias emergentes para entender las habilidades cognitivas y sensoriomotrices del ser humano. Tres de estas nuevas alianzas:
Dynamical Approaches: Le da prioridad a dimensión del tiempo y a las herramientas matematicas y visuales de las teorias de los sistemas dinamicos.
Embodied cognition: Se debe estudiar el cuerpo en relación a su medio ambiente y no solo la actividad interna del cerebro.
Neurociencias: Comprobar similitud de modelos cognitivos con neuroimagenes.
Capítulo 2: Connectionist Architectures - Bechtel
Redes conexionistas son sistemas intrincados de unidades simples que se adaptan dinamicamente a su ambiente. Algunas con miles de unidades, pero las con pocas unidades igual pueden comportarse de manera compleja y sutil. Ocurre en paralelo e interactivamente, VS procesamiento en serie de los modelos simbolicos.
2.1 Simulaciones de recuperación de memoria
2.1.1 Componentes del modelo (Aquí se introduce el ejemplo de Jets y Sharks)
a) Unidad: Componente más simple de una red.
b) Activación: Cada unidad tiene un valor de activación asociado. existen unidades visibles e invisibles, las primeras pueden recibir el estimulo externo (input) y activar a las invisibles, las invisibles solo pueden activarse por asociacion con las unidades visibles. (umbrales).
c) Conexiones de peso: Es la fuerza asignada a la conexión entre dos unidades. Se les asigna un peso binario y sus conexiones son bidireccionales y del mismo valor en ambas direcciones (en ejemplo de jets and sharks). Pueden ser +1, excitatoria (unidades simulataneas) o -1, inhibitoria (unidades excluyentes).
2.1.2 Dinamismo del modelo
2.1.2.1 Recuperación de la memoria: se genera un input en alguna de la unidades visibles. De esta forma se propaga el input en todas las unidades que hay, activando las unidades que corresponden a propiedades de la unidad de input inicial, y se inhiben las unidades que no corresponen con las propiedades de esta. Se repiten ciclos de procesamiento, por lo que en un principio la red se encuentra instable. Eventualmente llegará a un punto de estabilidad, en la que se pueden observar las unidades activas e inhibidas. Point atractor: momento en el que sistema se estabiliza y puede realizar un output relativamente certero.
2.1.2.2 Ecuaciones: Se deglosan las ecuaciones relevantes para entender el proceso que hace la red.
2.1.3 ilustraciones del dinamismo del modelo
2.1.3.1 A través de la acción de la red, se logrará también que al acceder al sistema a través de, por ejemplo, el nombre Art, no solamente recibimos las propiedades de Art, sino que también de todos los nombres de las personas (unidades ocultas) parecidas a él.
2.2 Diseño de la arquitectura conexionista
Jets and sharks no funciona para todos los casos, el conexionismo todavía está en sus inicios.
2.2.1 Patrones de Conectividad
a) Feedforward networks: Unidades organizadas en diferentes “capas”, en la que las unidades de una capa “alimentan” las unidades de la próxima capa, a través de conexiones unidireccionales (conexiones de peso).
b) Interactive Networks: Por lo menos algunas de las conexiones son bidireccionales entre las unidades. Esto significa que el procesamiento de información puede ocurrir tanto hacia delante como hacia atrás. El procesamiento de cualquier input ocurre en un gran número de ciclos Jets y sharks.
2.2.1.1 Feedforward networks: La configuración posee peso binario (activación o inhibición), pero se pueden conectar a varias unidades la capa de outputs. Cada conexión de input a output tiene un peso, en valores continuos específico, uno inhibitorio y otro excitatorio. Cada unidad de output tiene
...