Predicción del color y contenido de humedad en café cerezo mediante redes neuronales y regresión de mínimos cuadrados parciales
© Universidad Científica del Perú
Ciencia amazónica (Iquitos) 2015; 5(2): 91-103
http://dx.doi.org/10.22386/ca.v5i2.94
Artículo Original
Predicción del color y contenido de humedad en café cerezo
mediante redes neuronales y regresión de mínimos cuadrados
parciales
[Prediction of color and moisture content in coffee fruits by neural networks
and partial least squares regression]
Wilson Manuel Castro Silupu*, Ives Julian Yoplac Tafur, Cesar Augusto López Portocarrero
Facultad de Ingeniería Zootecnista, Agronegocios y Biotecnología. Universidad Nacional Toribio Rodríguez de Mendoza.
Ciudad Universitaria S/N, Barrio Higos Urco, Chachapoyas – Amazonas.
*
e-mail:
Resumen
La presente investigación se enfocó en el desarrollo de modelos de predicción del color en coordenadas
CIELab y el contenido de humedad de café cerezo mediante la tecnología de imágenes hiperespectrales;
comparando el ajuste por un modelo de regresión lineal múltiple – PLSR (Partialleastsquareregression) y un
modelo no lineal (ANN – artiftial neural network). La muestra se conformó de 200 granos de café cerezo en
diferentes estados de madurez, dividiéndola en 120 granos para calibración y 80 de validación.La muestra
fue caracterizada mediante colorimetría en el espacio CIELab y determinación de la humedad. Posteriormente
se adquirieron imágenes hiperespectrales de cada granos y se almacenaron en formato *.bil. El
procesamiento de las imágenes se realizó mediante un sistema desarrollado e implementado en el software
matemático Matlab 2010a, mediante funciones *.m e interfaces de usuario (GUIs). Se desarrollaron modelos
de ajuste para cada una de las coordenadas de color y el contenido de humedad, calculándose los
coeficientes de correlación en calibración y validación. Los resultados mostraron que las redes neuronales
tienen un mayor ajuste en calibración con coeficientes de correlación superiores a 0,90 mientras que el PLSR
genero coeficientes entre 0,42 y 0,48.
Palabras clave: ANN, CIELab, PLSR
Abstract
This research was focused on the development of prediction models for colour in CIELab coordinates and
the moisture content of coffee fruits by hyperspectral imaging technology; comparing the adjustment for
multiple linear regression model - PLSR (Partial least square regression) and a nonlinear model (ANN - neural
network artiftial). The sample consisted of 200 coffee fruits at different stages of maturity, dividing it into
120 grains for calibration and validation 80. The sample was characterized by colorimetry in the CIELAB
space and moisture determination. Later hyperspectral images of each grain is acquired and stored in * .bil.
The image processing was performed using a system developed and implemented in the mathematical
software Matlab 2010a through functions * .m and graphical user interfaces (GUIs). Were developed models
for each of the colour coordinates and the moisture content and calculated the correlation coefficients for
calibration and validation. The results showed that neural networks have a best adjustment in calibration
with correlation coefficients higher than 0.90 while the PLSR produce ratios between 0.42 and 0.48.
Keywords: ANN, CIELab, PLSR
Recibido: 10 de octubre de 2015
Aceptado para publicación: 15 de noviembre de 2015
91
Castro Silupu et al.
INTRODUCCIÓN
En la industria agroalimentaria el desarrollo de
sistemas de control de calidad eficaces y que
garanticen la producción segura de alimentos
durante las operaciones procesamiento es una
de las metas más buscadas por los científicos
de alimentos. En la actualidad muchos sistemas
de inspección de calidad alimentaria se realizan
por inspectores entrenados, lo cual es tedioso,
laborioso, lento, costoso y sujeto a subjetividad
y error humano. En este panorama el
desarrollo de métodos automatizados de
evaluación de la calidad optimiza el control del
proceso y elimina la subjetividad y errores
humanos. Es así que técnicas ópticas, no
destructivas, tales como el análisis de imagen
y la espectroscopia están disponibles
actualmente para la determinación y
aseguramiento de la calidad alimentaria
(Pallotino, Menesatti, Costa, Paglia, De
Salvador, 2010; Kumar and Mittal,2007;
Shankar, Sokhansanj, Bandyopadhyay, Bawa,
2010; Singh, Choudhary, Jayas, Paliwal, 2010).
La simplicidad, precisión y rapidez así como el
limitado nivel de preparación de las muestras
hacen de las técnicas ópticas las más
prometedoras en la determinación de las
propiedades físicas y químicas de los productos
agroalimentarios. De entre todas las técnicas
ópticas las imágenes hiperespectrales acoplan
tanto las ventajas de los sistemas de visión
como la espectroscopia; proporcionando
información del alimento, tanto espacial como
espectral de manera simultánea. Esta técnica
se puede definir como la “adquisición
simultánea de imágenes espaciales en muchas
bandas espectrales contiguas medidas a partir
de una plataforma de operación remota”
(Schaepman, 2007).
El principio básico de las imágenes
hiperespectrales se basa en el hecho de que
todas las muestras bajo análisis, reflejan,
dispersan, absorben y emiten energía
electromagnética
obteniendo
diferentes
patrones en longitudes de onda específicas
debido a la diferencia en la composición
química y estructura física inherente de la
muestra bajo análisis. Estas características se
denominan firmas espectrales o espectros de
huella digital. La firma espectral es la
característica única de la muestra bajo análisis.
Para un material dado, si el porcentaje de
reflectancia
(también
absorbancia
o
transmitancia) se representa frente a la
Cienc amaz (Iquitos) 2015; 5(2): 91-103
Predicción del color y contenido de humedad en café cerezo
longitud de onda, la curva resultante se conoce
como la “firma espectral” de ese material” (Wu
and Sun, 2013; Gómez, 2010).
Según Liu et al. (2013) un sistema de imágenes
hiperespectrales compuesto por una cámara,
un espectrógrafo, una lente, un sistema de
iluminación y un ordenador equipado con un
software de adquisición de imágenes. En el
caso de sistemas de escaneo lineal
(Pushbroom) la cámara es un detector
bidimensional que recoge simultáneamente la
información
espectral
y
espacial,
el
espectrógrafo es el corazón del sistema, se
caracteriza por no tener partes móviles para
generar un espectro en cada punto o línea
escaneada, la lente, delante del espectrógrafo,
enfoca el haz de luz procedente de la muestra
y la dispersa en diferentes direcciones de
acuerdo con la longitud de onda. Las señales
recogidas se expresan como imagen de dos
dimensiones, una dimensión representa el eje
espectral (λ) y la otra contiene la dimensión
espacial (X) de la línea analizada. La segunda
dimensión espacial (Y) se genera mediante el
movimiento de la muestra en la línea de la
unidad óptica a lo largo de la escena, la
resolución espectral del sistema depende de la
resolución del espectrógrafo, la magnitud de la
resolución espectral se determina por la
anchura de la rendija del espectrógrafo y el
tamaño de las abert (...truncated)