Personal tools
You are here: Home CLACSO - Red Academica Electronica de CLACSO - RAEC Usuarios javi Noticias 2 Aprendizaje en redes neuronales artificiales

Red Social "Becarios CLACSO"

Base de datos de los Centros Miembros de CLACSO

apoyo tecnológico

videoconferencias

radio

raecpedia

¿Por qué registrarse?

¿Quiénes somos?

Para CONTACTO: Equipo RAEC

Sitios amigos

Redes Avanzadas

Document Actions

Aprendizaje en redes neuronales artificiales

by javier jimenez morales last modified 2006-08-15 12:23

Guillermo Choque Aspiazu gchoque@sistemasintegrales.edu.bo

En un anterior artículo sobre las redes neuronales artificiales se hacia una breve introducción a la neurona biológica como elemento central del denominado procesamiento conexionista o masivamente paralelo, también se comentaba respecto a las capacidades de aprendizaje básico de las redes neuronales artificiales, agrupadas en dos fases principales: la fase de aprendizaje o entrenamiento y la fase de prueba. En la fase de entrenamiento, se reconocía el uso de un conjunto de datos o patrones de entrenamiento para determinar los pesos que definen el modelo neuronal. Una vez entrenado este modelo, se utilizaba este conjunto de patrones en la llamada fase de prueba o funcionamiento directo, en la que se procesan los patrones de prueba que constituyen la entrada habitual de la red, analizándose de esta manera las prestaciones definitivas de la red. A partir de este punto se amplia, en este articulo, la capacidad de aprendizaje de las redes neuronales artificiales..

Lo que se entiende por aprendizaje es difícil de describir, un proceso de aprendizaje, en el contexto de las redes neuronales artificiales puede ser considerado como el problema de actualizar la arquitectura de la red y fundamentalmente los pesos asociados a las conexiones, de modo tal que una red pueda ejecutar de manera eficiente una tarea especifica. El aprendizaje consiste en la presentación de patrones a la red, y la subsiguiente modificación de los pesos de las conexiones siguiendo una regla de aprendizaje determinada que trata de optimizar su respuesta, generalmente mediante la minimización del error o la optimización de alguna función de energía. Para el efecto se cuentan con los siguientes tipos fundamentales de aprendizaje: por una parte el aprendizaje supervisado que representa el modo de aprendizaje más sencillo, este aprendizaje consiste en la presentación de patrones de entrada junto a los patrones de salida deseados para cada patrón de entrada. Por otra parte se encuentra el aprendizaje no supervisado que consiste en no presentar a la red los patrones de salida deseados, haciendo que la red no sepa que resultados debe dar, sino que se deja a la misma seguir alguna regla de auto-organización. Un tercer tipo de aprendizaje, a medio camino entre los anteriores, es el llamado aprendizaje reforzado, en este caso el supervisor se limita a indicar si la salida ofrecida por la red es correcta o incorrecta, pero no indica que respuesta debe dar.

Cualquiera que sea el tipo de aprendizaje utilizado, una característica esencial de la red es la regla de aprendizaje usada, la cual indica como se modifican los pesos de las conexiones en función de los datos usados en la entrada, es decir, la historia de aprendizaje en la red. El aprendizaje requiere la presentación repetida de un número relativamente amplio de ejemplos de entrenamiento hasta lograr una respuesta satisfactoria del sistema, en función a la medida de error o función de energía utilizada..

Es usual disponer de un conjunto de datos distintos a los utilizados en el proceso de entrenamiento, para los cuales se conoce la respuesta correcta, y se usan como prueba, evaluando con ello si la red responde adecuadamente frente a datos distintos a los usados durante el aprendizaje, si es así se considera que la red funciona adecuadamente y que se puede pasar a la fase de aplicación, es decir, es posible utilizar la red neuronal para obtener un resultado frente a datos totalmente nuevos para los que no se conoce la respuesta correcta. Aunque la capacidad de aprendizaje es esencial y casi definitiva de lo que constituye en esencia una red neuronal artificial, se han desarrollado modelos que no requieren modificar los pesos de las conexiones, sino que son precalculados y preestablecidos antes de presentarle patrones a la red, como en las redes de Hamming y en las redes de Hopfield.

En términos algorítmicos, en el aprendizaje supervisado se presenta a la red una serie de patrones de entrada junto a los patrones de salida deseados. El aprendizaje consiste en la modificación de los pesos de las conexiones en el sentido de reducir la discrepancia entre la salida obtenida y la deseada. Los pasos asociados al algoritmo de aprendizaje supervisado son: los siguientes: (1) Aleatorizar los pesos de todas las conexiones, preferiblemente con valores pequeños, (2) seleccionar un par de entrenamiento, es decir, un patrón de entrada y el patrón de salida deseada, (3) Presentar el patrón de entrada y calcular la salida de la red mediante las operaciones usuales: la sumatoria de las entradas ponderadas, función de activación y transferencia a la siguiente capa, hasta llegar a la capa de salida. (4) Calcular el error o discrepancia entre la salida obtenida y la deseada. El error se suele definir como la suma de los cuadrados de las diferencias entre las salidas reales obtenidas y las deseadas, promediado para todas las unidades de salida y todos los patrones de entrenamiento. Si el error fuese menor de cierto criterio fijado de antemano, se incrementaría el número de ejemplos correctos; si se hubiesen clasificado correctamente todos los ejemplos el proceso finaliza; en caso contrario, el proceso sigue adelante. (5) Aplicar la regla de aprendizaje, es decir, ajustar los pesos de las conexiones tratando de disminuir el error, generalmente mediante el cálculo de tasas de variación o gradientes del error. Para reducir el error, habrá que modificar los pesos de las conexiones, en proporción a la tasa relativa de variación del error con respecto a la variación del peso, o sea, la derivada del error respecto al peso. Para que estos pasos produzcan un resultado adecuado es necesario repetir los mismos a partir del paso (2), hasta que se cumplan las condiciones de parada establecidas para este tipo de aprendizaje.

En el aprendizaje no supervisado no se requiere presentar patrones de salida deseados. Sin embargo, el algoritmo y la regla de modificación de las conexiones producen vectores de salida consistentes; esto es, la presentación de un patrón aprendido o parecido a él produce siempre la misma salida. Se considera que el proceso de aprendizaje es capaz de extraer ciertas propiedades estadísticas de los ejemplos de aprendizaje y agruparlos en categorías o clases de patrones similares. No se sabe a priori qué salida corresponderá a cada tipo o grupo de patrones de entrada, ni qué atributos usará para clasificarlos. En general, los métodos de aprendizaje no supervisado apelan a alguna noción de calidad de la representación. Las representaciones de calidad se caracterizan por la economía de la representación, sin perder la capacidad de reconstruir la información almacenada.

© 1997 - 2006 EL DIARIO S.A.


Powered by Plone, the Open Source Content Management System

This site conforms to the following standards: