Redes Perceptrón
Lineales
El objetivo de la fase de entrenamiento es determinar las funciones discriminantes,
que dictaminan las regiones de decisión. El Perceptrón Llineal
se diseñó para separar dos clases por un límite de
decisión lineal y ha evolucionado posteriormente hacia un
buen número de nuevas variantes.
Se distinguie entre el Perceptrón lineal
para Clasificación Binaria y Perceptrón
Lineal para múltiples clasificaciones.
Perceptrón lineal para Clasificación
Binaria
La estructura básica de un perceptrón lineal
se muestra en esta figura, con
una función discriminante
-

Se puede poner el umbral
como si fuese sólo
un parámetro más con los pesos. Denotando
,
como
-

y
-

esto es, z es el patrón aumentado x. Ahora la función
discriminante lineal se puede re escribir como
-

Se denonta que el valor de decisión es binario, esto es,
-

Un patrón se clasifica como
cuando d=1,
pertenece a
. El maestro determina si el patrón
es correctamente clasificado. Si y solo si ocurre una clasificación
errónea, la red será ajustada
Algoritmo
Durante la presentación del patrón de entrenamiento m-ésimo
,
el vector de pesos
se actualiza como
-

donde
es una tasa de entrenamiento positivo.
Más concretamente, la tasa anterior se puede ver desde dos perspectivas:
-
Entrenamiento reforzado: si un patrón que pertenece a una
clase
pero no es seleccionado, entonces el
vector de pesos debería ser reforzado añadiendo una proporción
de ese patrón de entrenamiento,
.
Nótese que
, así que la cantidad
que se actualiza es
.
-
Entrenamiento anti reforzado: si un patrón no pertenece a
pero es seleccionado, entonces el vector de pesos debería ser anti
reforzado sustrayéndole una proporción del patrón
de entrenamiento,
. Nótese ahora que
,
así que la cantidad que se actualiza es
.
El entrenamiento utiliza tantos barridos
como se necesiten, en cada uno de estos se presentan todos los patrones.
Al final de cada barrido, los
valores iniciales de los pesos
se fijan
a
antes de que se inicie el siguiente
barrido. Si no se produce ningún
error de clasificación durante un
barrido
entero, no se aprende nada en el barrido
y por lo tanto el proceso ha terminado.
Tasa de Entrenamiento Constante
La velocidad de convergencia para un perceptrón de velocidad
constante varía mucho, dependiendo de la elección de la tasa
de entrenamiento. Si es demasiado pequeña, será demasiado
lento. Por otro lado, si es demasiado grande, puede causar problemas numéricos.
La velocidad de convergencia no depende de lo grande que sea la región
factible de solución en el espacio w.
Perceptrón Lineal para Múltiples
Clasificaciones
El perceptrón básico se puede extender hacia el problema
de las clasificaciones múltiples (e.g., L) clases. Para conseguir
este propósito, incorporamos las siguientes características
al modelo general de DBNN:
-
Se diseña una subred para cada clase, esto es, una estructura OCON.
Observe esta figura.
-
Las funciones lineales discriminantes para cada subred se denota
,
para i=1, ..., L. La función discriminante da el valor para
cada subred.
-
Se utiliza una MAXNET
para seleccionar la subred o clase ganadora.
-
La salida es normalmente un símbolo que denota la clase ganadora.
Se puede utilizar el siguiente esquema para el entrenamiento. El símbolo
de salida se puede comparar con el símbolo del maestro. Si los dos
símbolos concuerdan, entonces la red seguirá trabajando por
si misma hasta que se presente el siguiente patrón. Si los símbolos
no concuerdan, entonces los pesos se actualizarán por las reglas
del entrenamiento reforzado y antireforzado.
Algoritmo
Supongamos que
es un conjunto dado de
patrones de entrenamiento, donde cada elemento
pertenece a una de las L clases
; y que las
funciones discriminantes son
para i
= 1, ..., L. Supongamos que se presenta el patrón m-ésimo
que se sabe pertenece a la clase
; y que la
clase ganadora es la llamada por el entero j, esto es, para todo
,
-

-
Cuando j=i, entonces el patrón
, entonces
el patrón es correctamente clasificado y no es necesaria ninguna
actualización.
-
Cuando
, esto es,
es clasificado erróneamente, entonces se realizará la siguiente
actualización:
-
Entrenamiento Reforzado:

-
Entrenamiento Antirenforzado:

Los otros pesos permanecen inalterados:
para todo
y
.
Redes Neuronales basadas en Decisión
Contenido
Redes Neuronales Artificiales
Sobre este tutorial