Sistema informático para contar semillas de Nicotiana tabacum

 

Computer system to count seeds of Nicotiana tabacum

 

 

Yunieski Martínez-Espinosa,I Juan L. Pérez-Rodríguez,II Cosme E. Santiesteban-Toca,III Evelio L. Báez-PerezIII

IDepartamento de Ciencias Informáticas, Universidad “Máximo Gómez Báez” de Ciego de Ávila, carretera a Morón km 19 ½, Ciego de Ávila, Cuba, 65400.
IIEstación Experimental del Tabaco carretera Santa Lucía km 2. Cabaiguán, Sancti Spíritus, Cuba.
IIILaboratorio de Informática Aplicada, Centro de Bioplantas, carretera a Morón km 19 ½, Ciego de Ávila, Cuba, 65400.

 

 


RESUMEN

En Cuba, la conservación de Nicotiana tabacum es de vital importancia debido a que constituye uno de los principales rubros en la exportación y sustentabilidad de la economía del país. La estación experimental de Cabaiguán en Sancti Spíritus, tiene entre sus funciones la conservación del material genético de Nicotiana tabacum. Debido al reducido tamaño de estas semillas (0,1-0,5 mm), su cuantificación es uno de los principales problemas, observándose inconsistencia en el resultado del conteo, alta tasa de error de un especialista a otro, labor intensiva y pérdida de tiempo. Por tal motivo, se propone desarrollar un sistema informático para la cuantificación de semillas de Nicotiana tabacum, basado en técnicas de procesamiento digital de imágenes. Las imágenes de las semillas se capturan en niveles de grises en un scanner convencional. La segmentación de la imagen se realiza por umbralización a partir del histograma de frecuencia de los niveles de grises. Las impurezas y ruidos en la imagen son eliminados a partir del tamaño. Se calcula el tamaño medio de las semillas y el número de semillas presente en cada clúster. Finalmente el número de semillas en la imagen es determinado. Para evaluar la calidad y efectividad del sistema propuesto se realizó una validación experimental en 15 imágenes conteniendo 1492 semillas, para diferentes resoluciones (150 dpi, 300 dpi, 600 dpi y 1200 dpi). Los resultados estadísticos demuestran la capacidad del sistema de contar las semillas con una precisión superior al 99 % para las resoluciones iguales o superiores a 300 dpi.

Palabras clave: calidad, material genético, procesamiento digital de imágenes.


ABSTRACT

In Cuba, conservation of Nicotiana tabacum is vital because it is one of the main items on the export and sustainability of the economy. The experimental station of Cabaiguán in Sancti Spiritus, whose functions include the conservation of genetic material from Nicotiana tabacum. Due to the small size of these seeds (0,1-0,5 mm), quantification has become one of the main problems, showing inconsistency in results of the count (high error rate) of a specialist to another, labor intensive and time lost. Therefore, it is propose to develop a computer system for quantification of Nicotiana tabacum seeds, based on techniques of digital image processing. Seedsimagesare captured ingray levelsina conventionalscanner. Image segmentation is performed by thresholding the histogram from the frequency of gray levels. Impurities and image noise are eliminated from size. The average seed size and number of seeds present in each cluster is calculated. Finally, the number of seeds in the image is determined. To assess the quality and effectiveness of the proposed system an experimental validation was performed on 15 images containing 1492 seeds for different resolutions (150 dpi, 300 dpi, 600 dpi and 1200 dpi). Statistical results prove the ability of the system to count seeds with an accuracy above 99 % for the same or higher than 300 dpi resolutions.

Key words: quality, genetic material, digital image processing.


 

 

INTRODUCCIÓN

En nuestro país, el tabaco (Nicotiana tabacum Linneaus), históricamente es uno de los productos agrícolas comercializables de mayor prestigio a nivel mundial. Con el fin de conservar este material genético en cualquiera de sus fórmulas reproductivas (semillas, esquejes, tubérculos, etc.) se han creado los “bancos de germoplasma”. Cuya misión consiste en ubicar, recolectar, conservar y caracterizar el plasma germinal de las plantas que, por sus atributos, son consideradas de interés prioritario, además de aportar conocimiento científico orientado a la optimización de la conservación y uso de los recursos fitogenéticos. Esto permite conservar el patrimonio genético vegetal y por tanto, la variabilidad genética de este género, lo que constituye el fundamento esencial de los programas de mejoramiento genético y de selección de genotipos.
A la par, se desarrollan y emplean técnicas de crioconservación para lograr condiciones de baja energía cinética molecular y una difusión extremadamente lenta, de tal forma que las reacciones químicas se encuentren prácticamente paralizadas; bajo estas condiciones, se postulan longevidades extremadamente largas. Sin embargo, estudios resientes muestran que después de un periodo de almacenamiento, donde no se muestran síntomas en la disminución de la calidad de las semillas, ocurre una rápida declinación de la viabilidad del material crioconservado (1).

Las condiciones de cultivo, cosecha y postcosecha, así como la humedad y la temperatura de almacenamiento son factores fundamentales que el operador debe tomar en consideración en el manejo de semillas en un banco de germoplasma (2). Por lo tanto, la influencia de estos factores debe ser evaluada antes de utilizar la crioconservación como estrategia segura para almacenar semillas del género Nicotiana (1, 2, 3). Para determinar el día óptimo de cosecha, el grado de madurez de la semilla juega un papel fundamental. Este parámetro guarda estrecha relación con la masa seca o fresca de las semillas. Sin embargo, teniendo en cuenta el reducido tamaño de estas semillas, entre 0,1 y 0,5 mm (Tabla I), su cuantificación manual es uno de los escollos principales en el procesamiento de las mismas. Factor que introduce un alto nivel de error en el proceso.



En los últimos años la incorporación de las técnicas de Procesamiento Digital de Imágenes (PDI) constituye una alternativa para la solución a este problema. Estas técnicas permiten la implementación de una amplia gama de aplicaciones con diversos objetivos, tales como inspección, clasificación, reconocimiento de objetos, mediciones, control de calidad y control de procesos, lo que las hace muy atractivas para el sector alimenticio y agrícola, al desarrollar sistemas para un amplio rango de productos, debido a que permite construir herramientas capaces de realizar una inspección y clasificación de forma objetiva, rápida, confiable y no invasiva, evitando afectar la calidad.

El PDI permite realizar mediciones lo más exactas posibles de los objetos y extraer el máximo de información contenida en la imagen, en dependencia del problema en sí. Estas medidas pueden ser tan simples como el número de objetos, tamaño o color del objeto, o más complicadas como la forma, conectividad o apariencia (textura) de los objetos. Existen numerosos ejemplos en la literatura de la aplicación de las técnicas de PDI en el análisis y cuantificación de semillas (3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15). No obstante, ninguna de estas aplicaciones permite el conteo de semillas tan pequeñas como las de Nicotiana tabacum.

Es por ello que en el presente trabajo se propone un sistema informático basado en técnicas de PDI para la cuantificación de semillas de tabaco contenidas en una imagen, que permita reducir el riesgo de error que se introduce en el proceso de conteo de las mismas.

 

MATERIALES Y MÉTODOS

Las investigaciones se realizaron en el laboratorio de Informática Aplicada del Centro de Bioplantas, Universidad de Ciego de Ávila, en colaboración con la Estación Experimental del Tabaco de Cabaiguán en Sancti Spíritus. El desarrollo, implementación y puesta a punto de los algoritmos así como el tratamiento de las imágenes, se realizó con la plataforma de procesamiento de imágenes AForge.NET y el ambiente de desarrollo SharpDeveloment ver. 4.4. Se trabajó con la variedad Nicotiana tabacum Linneaus cv SanctiSpíritus96 y las imágenes se capturaron con un scanner convencional CANNON, ImageCLASS, MF4570dw.

Para la puesta a punto de los algoritmos y del sistema en general se utilizaron 15 imágenes de semillas de tabaco que contienen 1492 semillas, cada una de las imágenes fue capturada con diferentes resoluciones (150 dpi, 300 dpi, 600 dpi y 1200 dpi). En la Figura 1 se muestra una de estas imágenes y dos secciones ampliadas. El análisis estadístico se realizó usando el paquete estadístico SPSS (16).

 

RESULTADOS Y DISCUSIÓN

Para realizar el conteo de las semillas, primeramente es necesario poder separar en la imagen qué es semilla y qué es fondo. Este proceso es conocido como segmentación y es un paso fundamental en el PDI, donde cada caso tiene sus particularidades en dependencia del tipo de imagen a analizar. Posteriormente es necesario detectar los objetos de interés (semillas) y eliminar los ruidos presentes en la imagen, ya sean por el proceso de captura de la imagen o por la misma naturaleza de la misma. Para realizar la segmentación y mejora de la imagen se siguieron una serie de pasos que se muestran en el algoritmo (Algoritmo 1) y que permitieron extraer cada semilla o grupo de semillas presente en la imagen.

Algoritmo 1. Proceso de mejora, segmentación y detección

1) Normalizar la imagen, empleando como rango los valores menor y mayor de los tonos de grises del histograma.

2) Umbralizar con un punto de corte que se calcula automáticamente en dependencia del histograma.

3) Realizar una transformación morfológica “Apertura” con el objetivo de eliminar posibles fragmentos de semillas partidas u otros ruidos presentes en la imagen.

4) Detectar las semillas o grupos de semillas a través de la detección de sus bordes.

En el proceso de conteo resulta muy común el solapamiento entre semillas. Esto afecta considerablemente la precisión del conteo realizado ya que cada grupo es considerado una sola semilla. Por esta razón, se aplica un algoritmo de conteo (Algoritmo 2) que incluye la aplicación oportuna de estadígrafos para la identificación de la cantidad de semillas.

Algoritmo 2. Proceso de conteo de las semillas

1) Calcular el área promedio de cada semilla o grupo de semilla.

a) Calcular el área de cada semilla o grupo de semilla.

b) Calcular el área promedio temporal.

c) Calcular el área promediode las áreas menores que el área promedio temporal.

2) Comparar el área promedio con las áreas de los elementos detectados, de esta forma es posible determinar la cantidad de semillas presentes en losgrupos.

3) Determinar el número total de semillas.

Evaluación de la herramienta propuesta

La efectividad del método propuesto está condicionada directamente a la calidad del proceso de toma de la imagen. La aparición de elementos indeseables como impurezas en las muestras influye directamente en el resultado final.

Para la evaluación de la herramienta propuesta, se realizó una simplificación del problema, reduciéndolo a dos clases: semillas (positivos) e impurezas (negativos). Donde las clasificaciones correctas serían las semillas correctamente detectadas que son cuantificadas como verdaderos positivos (VP) y las impurezas no detectadas como semillas que son cuantificadas como verdaderos negativos (VN). Mientras que las clasificaciones incorrectas serían las impurezas detectadas como semillas y las semillas clasificadas de más en los grupos, que son cuantificadas como falsos positivos (FP) y las semillas identificadas como impurezas y no identificadas en los grupos, que son cuantificadas como falsos negativos (FN). La efectividad (Acc) de la herramienta se calcula a través de la Ecuación 1 (8, 14).

Acc = (VP + VN)/ (VP + FP + VN + FN) (1)

El método desarrollado se explica a través de la Figura 2, donde se muestra la imagen de una pequeña cantidad de semillas de tabaco, con el objetivo de mostrar mayores detalles (a); el resultado de transformar la imagen original a escala de gris y su normalización, proceso necesario para la posterior segmentación (b); se obtiene una imagen binaria (c); se eliminan los ruidos presentes en la imagen como resultado de la operación morfológica “apertura”, y se calcula la cantidad de semillas en la imagen (d).



Para la evaluación de la herramienta propuesta, se procesaron un total de 1492 semillas separadas en 15 grupos. A su vez, se tomaron cuatro imágenes de cada grupo con las resoluciones (150 dpi, 300 dpi, 600 dpi y 1200 dpi), para un total de 60 imágenes. En todos los casos se realizó el conteo con la herramienta, aplicando las mismas configuraciones. Los resultados se muestran en la Tabla II.



Los resultados de la resolución de 150 dpi son pobres, de una efectividad del 89 %. Esto se debe a que en esta resolución los contornos de las semillas no están bien definidos, lo que se incrementa en la presencia de grupos de semillas.

Para las resoluciones de 300, 600 y 1200 dpi los resultados son similares con una efectividad superior al 99 %, por lo que se recomienda utilizar una resolución de 300 dpi por obvias razones de ahorro de memoria y disminución del tiempo de ejecución.

 

CONCLUSIONES

 

BIBLIOGRAFÍA

1. Walters, C.; Ballesteros, D. y Vertucci, V. A. ‘‘Structural mechanics of seed deterioration: Standing the test of time’’. Plant Science, vol. 179, no. 6, diciembre de 2010, (ser. Translational Seed Biology: From Model Systems to Crop Improvement), pp. 565-573, ISSN 0168-9452, DOI 10.1016/j.plantsci.2010.06.016.

2. Buitink, J.; Leprince, O.; Hemminga, M. A. y Hoekstra, F. A. ‘‘Molecular mobility in the cytoplasm: An approach to describe and predict lifespan of dry germplasm’’. Proceedings of the National Academy of Sciences, vol. 97, no. 5, 29 de febrero de 2000, pp. 2385-2390, ISSN 0027-8424, 1091-6490, DOI 10.1073/pnas.040554797, PMID: 10681458.

3. Bailly, C.; El-Maarouf-Bouteau, H. y Corbineau, F. ‘‘From intracellular signaling networks to cell death: the dual role of reactive oxygen species in seed physiology’’. Comptes Rendus Biologies, vol. 331, no. 10, octubre de 2008, (ser. Les graines de la vie / The seeds of life),
pp. 806-814, ISSN 1631-0691, DOI 10.1016/j.crvi.2008.07.022.

4. Zapotoczny, P. ‘‘Discrimination of wheat grain varieties using image analysis and neural networks. Part I. Single kernel texture’’. Journal of Cereal Science, vol. 54, no. 1, julio de 2011, pp. 60-68, ISSN 0733-5210, DOI 10.1016/j.jcs.2011.02.012.

5. Alvarenga, R. O.; Filho, J. M. y Junior, F. G. G. ‘‘Avaliação do vigor de sementes de milho superdoce por meio da análise computadorizada de imagens de plântulas’’. Journal of Seed Science, vol. 34, no. 3, 12 de septiembre de 2012, pp. 488-494, ISSN 2317-1545.

6. Chaugule, A. ‘‘Application of image processing in seed technology: A survey’’. International Journal of Emerging Technology and Advanced Engineering, vol. 2, no. 4, 2012, pp. 153–159, ISSN 2250-2459.

7. Chiquito, A. A.; Junior, G.; Guilhien, F. y Marcos-Filho, J. ‘‘Assessment of physiological potential of cucumber seeds using the software Seedling Vigor Imaging System® (SVIS®)’’. Revista Brasileira de Sementes, vol. 34, no. 2, junio de 2012, pp. 255-263, ISSN 0101-3122, DOI 10.1590/S0101-31222012000200010.

8. Daniel, I. O.; Adeboye, K. A.; Oduwaye, O. O. y Pobeni, J. ‘‘Digital seed morpho-metric characterization of tropical maize inbred lines for cultivar discrimination’’. International Journal of Plant Breeding and Genetics, vol. 6, no. 4, 2012, pp. 245–251, ISSN 1819-3595.

9. Mandal, S.; Roy, S. y Tanna, H. ‘‘A low-cost image analysis technique for seed size determination’’. Current Science, vol. 103, no. 12, 2012, pp. 1401–1403, ISSN 0011-3891.

10. Pourreza, A.; Pourreza, H.; Abbaspour-Fard, M.-H. y Sadrnia, H. ‘‘Identification of nine Iranian wheat seed varieties by textural analysis with image processing’’. Computers and Electronics in Agriculture, vol. 83, abril de 2012, pp. 102-108, ISSN 0168-1699, DOI 10.1016/j.compag.2012.02.005.

11. Shahin, M. A.; Symons, S. J. y Wang, N. ‘‘Predicting dehulling efficiency of lentils based on seed size and shape characteristics measured with image analysis: Predicting lentil dehulling with image analysis’’. Quality Assurance and Safety of Crops & Foods, vol. 4, no. 1, marzo de 2012, pp. 9-16, ISSN 17578361, DOI 10.1111/j.1757-837X.2011.00119.x.

12. Belsare, P. P. y Dewasthale, M. M. ‘‘Application Of Image Processing For Seed Quality Assessment: A Survey’’. International Journal of Engineering Research & Technology, vol. 2, no. 2, 28 de febrero de 2013, ISSN 2278-0181, [Consultado: 1 de febrero de 2016], Disponible en: <http://www.ijert.org/view-pdf/2329/application-of-image-processing-for-seed-quality-assessment-a-survey>.

13. Pazoki, A.; Pazoki, Z. y Sorkhilalehloo, B. ‘‘Rain Fed Barley Seed Cultivars Identification Using Neural Network and Different Neurons Number’’. World Applied Sciences Journal, vol. 22, no. 5, 2013, pp. 755–762, ISSN 1818-4952.

14. Sandeep, V. V.; Kanaka, D. K. y Keshavulu, K. ‘‘Seed Image Analysis: Its Applications in Seed Science Research’’. International Research Journal of Agricultural Science, vol. 1, no. 2, 2013, pp. 30-36, ISSN 2327-3321.

15. Kaur, J. ‘‘Digital image analysis based on automated counting clustered soybean seeds’’. International Journal of Computers & Technology, vol. 12, no. 3, 3 de enero de 2014, pp. 3325-3328, ISSN 2277-3061.

16. IBM SPSS Statistics [en línea]. versión 20, [Windows], edit. IBM Corporation, U.S, 2011, Disponible en: <http://www.ibm.com>.

 

 

Recibido: 15 de mayo de 2015
Aceptado: 27 de enero de 2016

 

 

Yunieski Martínez-Espinosa, Departamento de Ciencias Informáticas, Universidad “Máximo Gómez Báez” de Ciego de Ávila, carretera a Morón km 19 ½, Ciego de Ávila, Cuba, 65400. Email: ebaez@bioplantas.cu