El arándano tiene carne delicada y sabor único. Es rico en nutrientes y se conoce como la "reina de las frutas". Tiene las funciones de prevenir el envejecimiento del nervio cerebral, la protección de la vista, el cáncer y mejorar la inmunidad humana. Tiene amplias perspectivas del mercado. El contenido de azúcar de arándanos es un indicador importante para evaluar la calidad de los arándanos. La detección tradicional de contenido de azúcar de arándano es destructiva, y la detección no destructiva es una tendencia de desarrollo importante.
1. Adquisición de datos de imagen
Imagen de alto espectro de muestras de arándanos
Extraiga los datos espectrales de las dos imágenes hiperespectrales: seleccione diferentes regiones de interés (ROI) en la superficie de cada muestra y obtenga la curva de espectro de reflectancia original
En correspondencia con la curva espectral original del área de interés, el valor espectral promedio se extrae para obtener tres conjuntos de 48x256 matrices de datos espectrales
Según las imágenes hiperespectrales y las curvas espectrales en diferentes bandas, la banda 1 50 tiene un gran ruido e imágenes borrosas. Al seleccionar datos,
Solo banda 51-banda 250 (1031.11nm-1699.11nm) Se modelaron un total de 200 bandas. Los primeros 36 valores espectrales de arándanos se utilizaron para establecer el modelo,
y los últimos 12 se usaron para pruebas de modelo.
2. Establecimiento y análisis del modelo
El establecimiento del modelo de predicción de contenido de azúcar de arándano utiliza principalmente el método de regresión de mínimos cuadrados parciales (PLSR). Se obtienen diferentes datos espectrales
Diferentes modelos de predicción. Use directamente las 200 bandas con ruido eliminado para modelar las 200 bandas de datos espectrales para la reducción de dimensiones de PCA, seleccione el
Primero n componentes principales con una tasa de contribución acumulativa del 99.9%, y luego use el modelado PLSR para seleccionar las bandas características para el 256 espectral
bandas en toda el área trasera con SPA, y luego usan el modelado PLSR para realizar el modelado cíclico directamente en las 200 bandas en toda el área posterior, primero combinando
dos por dos, y luego usando tres por tres combinaciones para modelar
3. Establecimiento del modelo de predicción
Modelo PLSR de datos espectrales de algunas áreas del frente
Modelo de predicción:
y = 8.1109+0.3989x+0.2848x+….+0.809x200
Donde x1, x2, ..., x200 son los valores espectrales promedio de la banda 51-banda250, e y es el contenido de azúcar de los arándanos.
Usando el modelo de predicción, los datos espectrales de 12 arándanos se sustituyeron para obtener los valores predichos de contenido de azúcar como se muestra en la siguiente tabla
Tabla 1. Comparación de los valores predichos de contenido de azúcar y los valores reales de contenido de azúcar de algunas áreas en la parte delantera de los arándanos
Tabla 2. Valores de contenido de azúcar predicho y valores verdaderos para toda el área del lado frontal de los arándanos
Tabla 3. Valores de contenido de azúcar predicho y valores verdaderos para toda el área en la parte posterior de los arándanos
El valor de contenido de azúcar predicho del modelo de predicción obtenido de los tres conjuntos de datos y la curva del valor real de contenido de azúcar de los arándanos
PCA se usó para reducir la dimensión de los datos espectrales de arándanos. Los datos después de la reducción de la dimensión se usaron para el modelado PLSR. Después de la reducción de la dimensión PCA, se seleccionaron los primeros N componentes principales con una tasa de contribución total del 99.9%. Se seleccionaron siete componentes principales después de la reducción de la dimensión de los datos espectrales extraídos del área parcial del frente y del área completa del frente. Los primeros 10 componentes principales se extrajeron después de la reducción de la dimensión de los datos espectrales de toda el área de la parte posterior. Los componentes principales seleccionados después de la reducción de la dimensión PCA se usaron para el modelado PLSR. Según la función del modelo de predicción, se obtuvieron los valores predichos de contenido de azúcar de los tres conjuntos de datos.
Primero use PCA para reducir la dimensión y luego realice el modelado PLSR. Según la función del modelo de predicción, se obtienen las curvas del valor de contenido de azúcar predicho y el valor real de contenido de azúcar de los tres conjuntos de datos
4. Resumen
Comparando los modelos de predicción establecidos con datos diferentes, los coeficientes de correlación R entre el valor predicho de contenido de azúcar y el verdadero azúcar
El valor de contenido del modelo de predicción de combinación de banda óptimo seleccionado por el modelado de combinación de ciclo de banda es 0.54 y 0.61, respectivamente, que son
El más grande entre los modelos establecidos con otras combinaciones de banda, y los errores relativos promedio son 12.6% y 11.9%, respectivamente, que son los
Los más pequeños entre los modelos establecidos con otras combinaciones de banda, y el error cuadrado medio de la raíz del conjunto de pruebas es pequeño. Se puede concluir que el
El efecto de predicción del modelo óptimo seleccionado después del modelado de combinación de ciclo de banda es mejor que el de otras combinaciones de banda.