Estructuras de las Redes Neuronales Artificiales

Los aspectos más característicos de las estructuras son la estructura de conexión, el tamaño de la red y la elección entre ACON y OCON.

Estructuras de conexión de atrás hacia delante

Una red neuronal se determina por la neurona y la matriz de pesos . El comportamiento de la red depende en gran medida del comportamiento de la matriz de pesos. Hay tres tipos de capas de neuronas: la de entrada, las ocultas y la de salida. Entre dos capas de neuronas existe una red de pesos de conexión, que puede ser de los siguientes tipos: Hacia delante, hacia atrás, lateral y de retardo, tal como puede verse en la siguiente figura:

  1. Conexiones hacia delante: para todos los modelos neuronales, los datos de las neuronas de una capa inferior son propagados hacia las neuronas de la capa superior por medio de las redes de conexiones hacia adelante.
  2. Conexiones hacia atrás: estas conexiones llevan los datos de las neuronas de una capa superior a otras de la capa inferior.
  3. Conexiones laterales. Un ejemplo típico de este tipo es el circuito "el ganador toma todo" (winner-takes-all), que cumple un papel importante en la elección del ganador.
  4. Conexiones con retardo: los elementos de retardo se incorporan en las conexiones para implementar modelos dinámicos y temporales, es decir, modelos que precisan de memoria.
Las conexiones sinópticas pueden ser total o parcialmente interconectadas, como muestra la figura. También es posible que las redes sean de una capa con el modelo de pesos hacia atrás o bien el modelo multicapa hacia adelante. Es posible así mismo, el conectar varias redes de una sola capa para dar lugar a redes más grandes.

Tamaño de las Redes Neuronales

En una red multicapa de propagación hacia delante, puede haber una o más capas ocultas entre las capas de entrada y salida. El tamaño de las redes depende del numero de capas y del número de neuronas ocultas por capa.

AproximacionesACON frente a OCON

Abordamos el problema de cuantas redes son necesarias para la clasificación en multicategorias. Típicamente, cada nodo de salida se usa para representar una clase. Por ejemplo, en un problema de reconocimiento alfanumérico, hay 36 clases; así que en total habrá 36 nodos de salida. Dado un patrón de entrada en la fase de prueba, el ganador (i.e., la clase que gana) es normalmente el nodo que tiene el valor más alto a la salida.

Dos posibles tipos de arquitectura son "All-Class-in-One-Network" (ACON), esto es, todas las clases en una red y "One-Class-in-One-Network" (OCON), esto es, una red para cada clase. En la aproximación ACON, todas las clases son reconocidas dentro de una única súper red. En algunos casos es ventajoso descomponer esta macro red en varias subredes mas pequeñas. Por ejemplo, una red de 36 salidas se puede descomponer en 12 subredes, cada una responsable de tres salidas. La descomposición mas extrema es la llamada OCON, donde una subred se dedica para una sola clase. Aunque el número de subredes en la estructura OCON es relativamente largo, cada subred individual tiene un tamaño menor que la red ACON. Esto se puede explicar con las siguientes figuras,

la red entera

se divide en

varias subredes.

Por conveniencia, supongamos que todas las redes tienen el mismo tamaño, por ejemplo k. El número de unidades ocultas de las macro-red ACON se denota por K. Obviamente, k << K. Las dos estructuras difieren claramente en tamaño y rapidez, esto es, en el número total de pesos sinápticos y en el tiempo de entrenamiento. Sean los vectores de entrada y salida de dimensiones n y N respectivamente. El número total de pesos sinápticos es para la estructura ACON (N+n) * K. De la misma forma, el número para la estructura OCON es N * (n+1) * k approx. N*n * k . Los dos casos extremos son analizados a continuación. Cuando N es relativamente pequeña (comparado con n), la estructura ACON podría tener el mismo número de pesos o algo menos que la OCON. Si N es muy grande, entonces la OCON podría tener una mayor ventaja en términos del tamaño de la red. Además, la OCON parece ser que aventaja a la ACON en la rapidez de reconocimiento y entrenamiento cuando el número de clases es grande.

En la estructura ACON, la única macro-red tiene que "satisfacer" todas estas clases, así que el número de unidades ocultas K ha de ser muy grande.


Aplicaciones

Contenido


Redes Neuronales Artificiales
Sobre este tutorial