Modelado Difuso
juancambb27 de Agosto de 2014
3.063 Palabras (13 Páginas)292 Visitas
Modelado de sistemas difusos para la predicción en la producción de café excelso mediante Aprendizaje Supervisado y Algoritmo evolutivo
Modeling fuzzy system for prediction for the production of coffee by lofty Supervised Apprenticeship and Evolutionary Algorithm
Daniel Felipe Hernández Tovar
Universidad Distrital Francisco José de Caldas
Bogotá D.C., Colombia
dfhernandezt@correo.udistrital.edu.co
Resumen— En este artículo se propone la predicción en la producción de sacos de café excelso. Se presenta puntualmente en el departamento del Huila, Colombia, para predecir la cantidad producida de sacos de café para el siguiente mes, esta predicción se da mediante dos algoritmos, se realiza un comparación entre el algoritmo de aprendizaje supervisado back propagation y el algoritmo genético compacto (CGA), los resultados después de los experimentos apuntan a que es posible predecir satisfactoriamente la cantidad producida mensual de sacos de café , el desempeño de los algoritmos estará enmarcado por su error cuadrático medio y las iteraciones para su convergencia , para este caso en particular el desempeño basado en CGA es mejor dado que el error disminuye , aunque no converge tan rápidamente.
Palabras clave— Algoritmo evolutivos, Algoritmo evolutivo compacto, Aprendizaje supervisado, Café excelso, Gradiente Predicción, Sistemas difusos.
Introduccion
El café es uno de los productos insignia de Colombia desde hace varias décadas; es altamente reconocido y valorado a nivel internacional por su alta calidad, el gran volumen de producción que se genera en el país y por tener una alta participación en las exportaciones realizadas.
Colombia es el mayor productor de café de calidad en el mundo, siendo el café nacional uno de los más apetecidos en el mercado internacional y representándole al país una de las más grandes fuentes de exportación.
Algunos estudios demuestran que desde el año 1730 se introdujo el café en Colombia; desde ese año empezó a expandirse la producción en las demás regiones del país, llegando al departamento del Huila en el año 1900. Desde mediados del siglo XIX el café empezó a consolidarse como producto de exportación, llegando a los mercados estadounidenses y a países como Alemania y Francia, fenómeno que produjo una expansión en la economía colombiana; explicando entonces, que el café es uno de los productos más antiguos e importantes del país.
Además, el crecimiento del consumo mundial y la escasez relativa de la oferta de Café, constituyó un factor determinante para que un 99% de la producción colombiana estuviera representada en exportaciones; por lo que fue necesario realizar importaciones cercanas a 900 mil sacos para abastecer el mercado interno, para el 2011(FNC); lo anterior confirma la creciente demanda del mercado no solo interno sino a nivel internacional del café en el mundo, de ahí la importancia de conocer el nivel de producción que se tiene en el país; y especialmente de la región del sur del Huila (municipios de Acevedo, San José de Isnos, San Agustín y Palestina), dado que se caracterizan por tener uno de los índices más elevados de producción que están en el 16,01 % de la producción y de mejor calidad a nivel nacional.[1]
En este artículo se propone la utilización algoritmo de back propagation aplicado a un sistema difuso y además se propone utilizar un algoritmo genético compacto , los cuales realizaran la predicción en la producción mensual de café excelso, se presenta puntualmente sobre el departamento del Huila , a partir de la producción en los 4 meses anteriores[2].Este tipo de sistema podría ayudar en la toma de decisiones logísticas y económicas frente a las variaciones en la producción del departamento.
En la sección II introduce algunos principios metodológicos de las propuestas a trabajar. La sección III presenta la implementación del algoritmo de aprendizaje supervisado back propagation. La sección IV presenta la sintonización de parámetros mediante un algoritmo evolutivo compacto. Para los dos algoritmos se muestran y se discuten los resultados obtenidos. Por ultimo en la sección V se concluye.
Preliminares
A continuación se muestra de forma general los conceptos involucrados en el desarrollo de la implementación.
Sistemas difusos.
En los sistemas de inferencia difusa existe cuatro elementos importantes que los constituyen que son: fuzzifier, motor de inferencia, reglas, y el defuzzifier. En donde el encargado de sensar o mapear la entrada es el fuzzifier dentro de los conjuntos difusos, el motor de inferencia se encargar de relacionar las reglas con la salida del fuzzifier, creando reglas haciendo vínculos entre el antecedente y el consecuente, las reglas son creadas por los expertos a partir de datos previos, que están expresadas en términos de sentencias de si- entonces.
A continuación se presenta la representación matemática de la expansión de funciones de base difusa. EFBD
El FIS representado por (1), (2) y (3) tiene las siguientes características: Singleton fuzzificattion, T-norma producto, motor de inferencia producto, defuzzificacion por promedio de centros y una función de pertenencia gaussiana.
Además el índice l hace referencia a la l-ésima regla, siendo M el total de reglas, el índice i hace referencia a al i-ésima entrada y N es el total de las misas.
Back Propagation
Normalmente, la Backpropagation utiliza tres o más capas de unidades procesadoras. La Figura 1 muestra la topología backpropagation típica de tres capas. La capa inferior es la capa de entrada, y se caracteriza por ser la única capa cuyas unidades procesadoras reciben entradas desde el exterior. Sirven como puntos distribuidores, no realizan ninguna operación de cálculo. Las unidades procesadoras de las demás capas procesan las señales como se indica en la figura 1. La siguiente capa superior es la capa oculta, y todas sus unidades procesadoras están interconectadas con la capa inferior y con la capa superior. La capa superior es la capa de salida que presenta la respuesta de la red.
Figura 1. Representación en red de la expansión de base difusa.
Una vez se ha completado la fase de propagación hacia adelante se inicia la fase de corrección o fase de propagación hacia atrás. Los cálculos de las modificaciones de todos los pesos de las conexiones empiezan por la capa de salida y continua hacia atrás a través de todas las capas de la red hasta la capa de entrada. La variable η es el coeficiente de aprendizaje el cual da la velocidad con que se recorre el mapa de error del sistema.[2]
C. Algoritmo genético compacto.
Por medio del modelo matemático conocido como paseo aleatorio [3], se puede analizar el crecimiento o caída de un gen (característica) de un individuo en un proceso evolutivo. En el transcurrir de las generaciones, este gen, lucha con sus competidores y prevalecerá dependiendo de las decisiones que el algoritmo tome, entendiendo como decisión el proceso de selección de los individuos que conforman la siguiente generación. La variable que determina el crecimiento o la caída de un gen es la población n, que representa la cantidad de individuos generados en un proceso evolutivo [3].
Figura 2. Diagrama de bloques de un FIS con CGA. tomada de [4]
RMSE
Error Cuadrático Medio (Root Mean Square Error, RMSE) es el promedio especial de las diferencias al cuadrado entre la predicción y el análisis del modelo o de las observaciones de verificación, válidas para el mismo instante [5] la ecuación que la describe es la siguiente (4):
(4)
Solución mediante algoritmos de aprendizaje supervisado (Back Propagation)
3.1 Datos
Estos datos abarcan des el mes de enero de 1958 hasta julio del 2013, son de libre acceso y fueron tomados de la página web de la asociación nacional de cafeteros [6], con un frecuencia mensual, con lo cual se tienen un total de 692 registros de la producción de café, en la figura 3 se muestra la producción de café mensual desde enero de 1998 hasta noviembre de 2013.
Figura 3. Producción mensual de café desde enero de 1958 hasta noviembre del 2013.
Los registros en la producción están normalizados frente a la mayor producción realizada, las variables a considerar son os niveles de producción de los meses anteriores, se estimó que la predicción no dependía de más variables debido a un análisis preliminar , lo cual nos dejaría 4 entradas para nuestro sistemas difuso.
Debido a que el objetivo del algoritmo es la predicción de la producción de café el siguiente mes dependiendo de la producción en los cuatro meses inmediatamente anterior como se ve en la figura 4 donde hay un esquema en bloques del funcionamiento básico del sistema.
Figura 4. Diagrama de bloques de la FIS para la predicción.
Para la etapa de entrenamiento de utiliza el 70% de los datos disponibles, en este caso es 483, y para la validación el 30% restante.
3.2 Experimentos
En las siguientes tablas se evidencian los valores de los parámetros que enmarcan los experimentos realizados. En la tabla 1 se presentan el número de reglas y entradas para los experimentos. Para este algoritmo se variara el
...