Cultivos Tropicales Vol. 43, No. 3, julio-septiembre, 2022, ISSN: 1819-4087
Código QR
CU-ID: https://cu-id.com/2050/v43n3e07
Artículo original

Gestión de macrodatos para el programa de mejora genética de la caña de azúcar

 

iDReynaldo Rodríguez-Gross1Estación Territorial de Investigaciones de la Caña de Azúcar Oriente Sur. Cuba*✉:reynaldo.rodriguez@inicasc.azcuba.cu

iDYaquelin Puchades-Isaguirre1Estación Territorial de Investigaciones de la Caña de Azúcar Oriente Sur. Cuba

iDWilfre Aiche-Maceo1Estación Territorial de Investigaciones de la Caña de Azúcar Oriente Sur. Cuba

iDHéctor García-Pérez2Instituto de Investigaciones de la Caña de Azúcar (INICA). Cuba


1Estación Territorial de Investigaciones de la Caña de Azúcar Oriente Sur. Cuba

2Instituto de Investigaciones de la Caña de Azúcar (INICA). Cuba

 

*Autor para correspondencia: reynaldo.rodriguez@inicasc.azcuba.cu

RESUMEN

El objetivo de este trabajo fue diseñar y establecer un modelo de gestión de macrodatos para facilitar la toma de decisiones en el Programa de Mejoramiento de la caña de azúcar en Cuba e incrementar su eficiencia. Para esto se utilizaron las fuentes de información disponibles del proceso de selección del período 2000 al 2017 y las procedentes de la respuesta agroproductiva de los cultivares en áreas de producción. Se diseñó y aplicó un modelo que incluye los componentes: infraestructura, colección, validación, almacenamiento, procesamiento, análisis y visualización. Se realizó un estudio de caso del cruce C86-12 x CP70-1133 para caracterizar sus antecedentes de selección. Como resultado, el enfoque big data permitió obtener una compilación de datos primarios y resultados de selección, estimar el valor genético de progenitores y cruces, clasificar los cruzamientos y facilitar la toma de decisiones en el programa de mejoramiento de la caña de azúcar en Cuba para la obtención de nuevos cultivares comerciales. Su aplicación en el caso de estudio garantizó acceder a toda la información disponible al respecto y recomendar su mejor manejo.

Palabras clave: 
hibridación, TIC, métodos estadísticos

Received: 20/1/2021; Accepted: 25/7/2021

CONTENIDO

INTRODUCCIÓN

 

El empleo de técnicas y métodos de macrodatos a la agricultura constituyen una gran oportunidad para el uso de tecnologías en función de la inversión y de la percepción del valor adicional de estas dentro del sector agroalimentario (11. Sun J, Zhou Z, Bu Y, Zhuo J, Chen Y, Li D. Research and development for potted flowers automated grading system based on internet of things. Journal of Shenyang Agricultural University [Internet]. 2013;44(5):687-91. Available from: https://www.cabdirect.org/cabdirect/abstract/20133406244 ,22. Yang C. Big Data and its potential applications on agricultural production. Crop, Environment & Bioinformatics [Internet]. 2014;11(1):51-6. Available from: https://www.cabdirect.org/cabdirect/abstract/20143190953 ). El paradigma de macrodatos, datos masivos o big data es bastante reciente y desempeña un papel importante en la mejora de la eficiencia de toda la cadena de suministro y en la mitigación de los problemas de seguridad alimentaria (33. Chen M, Mao S, Liu Y. Big data: A survey. Mobile networks and applications [Internet]. 2014;19(2):171-209. Available from: https://dl.acm.org/doi/10.1007/s11036-013-0489-0 ).

Las aplicaciones de macrodatos en la agricultura no se refieren estrictamente a la producción primaria de grandes conjuntos de datos, sino que basan las tareas de gestión en la interconexión de formas automatizadas de recopilación y almacenamiento con funciones de reconocimiento de patrones (44. Mazzocchi F, Lapointe FJ. Sobre el ‘big data’:¿ Cómo podríamos dar sentido a los macrodatos? Mètode: Revista de difusión de la Investigación [Internet]. 2020;1(104):34-41. Available from: https://dialnet.unirioja.es/servlet/articulo?codigo=7391781 ). Si bien el enfoque big data tiene en cuenta la variabilidad en el campo, necesita herramientas de reconfiguración en tiempo real para agilizar la toma de decisiones, y generalmente incluyen asistencia inteligente en la implementación, mantenimiento y uso de la tecnología (55. Wolfert S, Ge L, Verdouw C, Bogaardt M-J. Big data in smart farming-a review. Agricultural systems [Internet]. 2017;153:69-80. Available from: https://www.sciencedirect.com/science/article/pii/S0308521X16303754 ).

Los programas de mejoramiento genético de la caña de azúcar siguen cuatro pasos claves: (i) la generación de una gran población de progenie a partir de cruces específicos, (ii) la evaluación de esa descendencia en diferentes etapas, (iii) la selección de clones con características superiores, y (iv) recombinación de los clones seleccionados para cerrar el ciclo, o para iniciar uno nuevo. Este es un proceso relativamente largo (nunca inferior a los 10 años), que consume recursos y genera gran cantidad de información que debe ser resumida en diferentes formas (66. Park S, Jackson P, Berding N, Inman-Bamber G. Conventional breeding practices within the Australian sugarcane breeding program. In: Proceedings of the Australian Society of Sugar Cane Technologists [Internet]. 2007. p. 113-21. Available from: https://www.researchgate.net/profile/Nils-Berding/publication/305390103_Conventional_breeding_practices_within_the_Australian_sugarcane_breeding_program/links/578c603608ae5c86c9a14e99/Conventional-breeding-practices-within-the-Australian-sugarcane-breeding-program.pdf ,77. Yadav S, Jackson P, Wei X, Ross EM, Aitken K, Deomano E, et al. Accelerating genetic gain in sugarcane breeding using genomic selection. Agronomy [Internet]. 2020;10(4):585. Available from: https://www.mdpi.com/2073-4395/10/4/585 ).

El Instituto de Investigaciones de la Caña de Azúcar de Cuba (INICA) desarrolla un programa de mejoramiento genético para dar respuesta a la obtención de cultivares (88. González R. Variedades de caña de azúcar cultivadas en Cuba. Cronología, legislación, metodologías y conceptos relacionados. Instituto Cubano de Investigaciones de Derivados de La Caña de Azúcar; 2019.). Esto implica que anualmente maneja un extenso volumen de datos provenientes de una población grande de clones y cultivares en diferentes etapas de selección.

Para capturar, almacenar y procesar la información obtenida en el Programa de Mejora de la caña de azúcar en Cuba se dispone de un programa informático (SASEL) que permite mejorar la eficiencia de todo el proceso (99. Rodríguez R, Puchades Y, Abiche W, Rill S, García H. SASEL: software for data management generated in the Cuban sugarcane-breeding program. In: Proceedings of the International Society of Sugar Cane Technologists. 2016. p. 63-6.). Sumado a lo anterior existe información proveniente de la respuesta de los cultivares en condiciones de producción, tanto de rendimiento como de reacción frente a las plagas, que no se toma en consideración, de manera dinámica, para corregir el programa de cruzamiento de la caña de azúcar.

El objetivo de este trabajo fue diseñar y establecer un modelo de gestión con un enfoque de macrodatos asistido por la interface SASEL para facilitar la toma de decisiones en el programa de mejoramiento de la caña de azúcar en Cuba e incrementar la eficiencia de este.

MATERIALES Y MÉTODOS

 

Para la realización del modelo de gestión de los macro datos del programa de mejora de la caña de azúcar se tuvo en cuenta el desarrollo de sus componentes como son:

Infraestructura y seguridad digital: El Programa de Mejora con una red de ambientes de prueba (once), que son representativos de las principales condiciones en las que se cultiva la caña de azúcar en el país (Figura 1). La misma es atendida y mantenida por siete estaciones experimentales provinciales y seis grupos de extensión y servicios agrícolas, todos dotados del personal (investigadores, técnicos y especialistas) y del equipamiento necesario (invernaderos, laboratorios de biología molecular, diagnóstico, semilla, fisiología y análisis azucarero). Posee además un centro exclusivamente para generar variabilidad a través de la hibridación. Esta infraestructura asegura la colección de datos tantos de los nuevos estudios de cultivares como los plantados en áreas de producción de caña de azúcar.

Figura 1.  Red experimental para el trabajo de mejoramiento genético de la caña de azúcar en Cuba

Validación de la información: Todo el proceso de mejora genética (incluye generación de variabilidad, selección, pruebas de resistencia a plagas, extensión en áreas comerciales) se rige por Normas y Procedimientos (1010. Jorge H, González R, Casas M, Jorge I. Normas y procedimientos del programa de mejoramiento genético de la caña de azúcar en Cuba. PUBLINICA, La Habana. 2011;), que permiten estandarizar los procederes y estructurar las bases de datos de la información generada, auditable por la dirección del programa, al mismo tiempo que es validada.

Colección, almacenamiento y organización de los datos: Los datos tienen un registro físico en el expediente o protocolo de cada ensayo. Para facilitar su digitalización y manejo se dispone de una aplicación informática denominada SASEL (99. Rodríguez R, Puchades Y, Abiche W, Rill S, García H. SASEL: software for data management generated in the Cuban sugarcane-breeding program. In: Proceedings of the International Society of Sugar Cane Technologists. 2016. p. 63-6.). La misma a nivel de provincia estratifica la información por año de selección o serie, combinación, etapa y cepa y para el análisis nacional adiciona a la provincia.

Herramientas para el análisis, modelación y visualización: A las bases de datos de selección ya sea de una serie en particular o compilación en tiempo y espacio (varias series, etapas y localidades) se le determinan parámetros genéticos-estadísticos como la media, desviación estándar, varianza y diferencial de selección.

Adicionalmente a los parámetros genéticos-estadísticos, se utilizaron los datos individuales de los cruces de una serie o compilados de varias series para determinar un índice de selección simultánea en el estimado del valor genético (EVG) de cruces y progenitores (1111. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W, Cornide-Hernández MT. Modelo matemático para estimar el valor genético de progenitores y cruces en caña de azúcar. Cultivos Tropicales [Internet]. 2018;39(2):81-8. Available from: http://scielo.sld.cu/scielo.php?pid=S0258-59362018000200011&script=sci_arttext&tlng=en ). Con los valores del EVG se confeccionó una metodología de evaluación de cruces para clasificar los mismos desde muy comprobados a muy descartado (1212. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W. Metodología de validación y manejo de cruces en la mejora genética en caña de azúcar. Cultivos Tropicales [Internet]. 2020;41(1). Available from: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S0258-59362020000100002 ). Estas herramientas matemáticas de análisis multivariados fueron utilizadas en su conjunto para el procesamiento de la cadena de macrodatos generados en el proceso de mejora genética.

Para la visualización de los datos y sus análisis se contó con los informes predeterminados de la interface SASEL, además de las consultas personalizadas que se pueden realizar. Por otra parte, se reestructuró el modelo de relaciones de bases de datos de la plataforma informática SASEL a un nuevo enfoque de big data que incluyó las bases de datos relacionales, semi relacionales y no relacionales:

  • Compilación de datos primarios de selección en campo de la primera y segunda etapa clonal por series y territorios.

  • Compilación de resultados de selección en campo de la primera y segunda etapa clonal por series y territorios.

  • Estimado del valor genético de progenitores y cruces y clasificación

Estudio de caso. Resultados de selección en la primera y segunda propagación clonal.

 

Como ejemplo del enfoque Big-Data se procesó una cadena de datos resultantes del proceso de selección en las etapas clonales I y II del esquema de selección vigente, correspondientes a las progenies obtenidas en el período 2000-2007, del cruce biparental entre los progenitores femenino y masculino respectivamente C86-12 y CP70-1133, evaluado en los sitios de prueba o ambientes de selección correspondientes a las provincias Villa Clara, Holguín y Santiago de Cuba.

El universo de datos abarcó 160 806 clones (no entiendo bien lo de los 1738 cruces, a menos que se haya tenido en cuenta dentro de esos cruces la participación de los progenitores C86-12 y CP70-1133) procesados con el auxilio de la aplicación SASEL que permitió obtener los resúmenes de la selección por series y territorios.

RESULTADOS Y DISCUSIÓN

 

El esquema de gestión de macrodatos para el programa de mejora genética de la caña de azúcar en Cuba tiene en cuenta la información que se genera en el proceso de selección de nuevos cultivares, así como las evaluaciones realizadas en áreas de producción comercial (Figura 2). Este diseño se basó en la integración de bases de datos relacionales, semirelacionales y no relaciones.

Figura 2.  Esquema de gestión de macrodatos para el programa de mejora genética de la caña de azúcar en Cuba

La información primaria está almacenada en diferentes bases de datos como son: programa de cruzamientos, evaluaciones, selección en campo y pruebas de resistencia. Todas estas determinaciones se obtienen por series o años, sitio de mejoramiento y etapas del esquema de selección.

Las evaluaciones de la respuesta agroproductiva de los cultivares en áreas de producción y porcentajes de áreas ocupadas, pruebas de validación comercial de nuevos cultivares y encuestas fitosanitarias también forman parte del esquema big data. Estas bases de datos poseen entre ellas y el programa de mejora una relación no siempre relacional o estructurada; es decir, que pueden proveerse en diferentes formatos y de diferentes fuentes.

La gestión de macrodatos permite el almacenamiento, organización y validación de los datos, para luego analizarlos, modelarlos y visualizarlos. El núcleo de análisis y procesamiento (Figura 2), está sostenido por la aplicación de análisis estadísticos, análisis de series en tiempo y espacio, modelos matemáticos y estimado del valor genético (1111. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W, Cornide-Hernández MT. Modelo matemático para estimar el valor genético de progenitores y cruces en caña de azúcar. Cultivos Tropicales [Internet]. 2018;39(2):81-8. Available from: http://scielo.sld.cu/scielo.php?pid=S0258-59362018000200011&script=sci_arttext&tlng=en ), así como metodologías de clasificación de cruces y progenitores (1212. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W. Metodología de validación y manejo de cruces en la mejora genética en caña de azúcar. Cultivos Tropicales [Internet]. 2020;41(1). Available from: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S0258-59362020000100002 ). Con los resultados obtenidos en estos análisis se facilita la toma de decisiones en el programa de mejoramiento de la caña de azúcar en Cuba, lo que trae consigo un incremento en la eficiencia de este y en las recomendaciones de la composición de cultivares en áreas de producción comercial.

Por otra parte, se obtuvo una nueva opción de la interface SASEL para el manejo y visualización de los datos en entorno big data (Figura 3). Es importante destacar los cuatro elementos fundamentales que la integran. El recuadro a1 lo componen las bases de datos con el registro de progenitores y cruces a procesar. Esta información puede provenir del listado de cruce o hibridación, fichero de la serie en uso o datos introducidos manualmente.

(a1- registro de progenitores, a2- fuente de información, a3- Datos colectados o procesados, a4- Salidas del informe)
Figura 3.  Interface para el manejo y visualización de macrodatos

El recuadro a2 y a3 se distingue la fuente o base datos de donde se obtiene la información de los progenitores y cruces seleccionados, y si esta información es primaria o procesada previamente con la aplicación análisis estadísticos y modelos matemáticos. Las bases de datos que se encuentran integradas en esta opción son: (i) etapa de posturas; (ii) etapa de lotes clonal 1 y 2; (iii) estudios replicados; (iv) valor genético de los cruces; (v) variedades comerciales y (vii) pruebas de resistencia que incluye las encuestas fitosanitarias.

El recuadro a4 revela el tipo de salida y el alcance de la información consultada. Es posible realizar análisis individuales por progenitores, serie, territorio o etapa y también se pueden obtener resúmenes integrales. Es en esos últimos donde mejor se aprecia el enfoque big data pues la información se visualiza resumida lo que facilita su comprensión y con ello la toma de decisiones.

Esta interconexión de bases de datos ha permitido obtener una compilación de resultados sobre la cantidad de cruzamientos evaluados por el programa de mejoramiento genético, su frecuencia y sus resultados. También se obtuvo un modelo matemático para estimar el valor genético de progenitores y cruces (1111. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W, Cornide-Hernández MT. Modelo matemático para estimar el valor genético de progenitores y cruces en caña de azúcar. Cultivos Tropicales [Internet]. 2018;39(2):81-8. Available from: http://scielo.sld.cu/scielo.php?pid=S0258-59362018000200011&script=sci_arttext&tlng=en ), y el mismo constituye la base de la metodología para la clasificación de los cruzamientos (1212. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W. Metodología de validación y manejo de cruces en la mejora genética en caña de azúcar. Cultivos Tropicales [Internet]. 2020;41(1). Available from: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S0258-59362020000100002 ). Este último resultado tiene en consideración la interacción genotipo ambiente, lo que sin dudas constituye una valiosa herramienta para incrementar la eficiencia del programa de mejora.

La incorporación de nuevas bases de datos provenientes de evaluaciones en áreas de producción comercial brinda la posibilidad de nuevas salidas en función de mejorar las recomendaciones de la composición de cultivares y su manejo.

Caso de estudio. Antecedentes de resultados de selección y valor genético en etapas clonales 1 y 2

 

La consulta realizada sobre los antecedentes de selección en las bases de datos de los lotes clonales 1 y 2 del cruce C86-12 x CP70-1133 mostró los resultados de su participación en el período de estudio de las series del 2000 al 2017 (Tabla 1). Esta salida es producto de la recopilación, procesamiento, análisis e interconexión de seis cadenas de datos:

  • a1) Datos colectados en las evaluaciones de selección de las etapas clonales 1 y 2. En el período de estudio, solamente se encontraron siete series donde participó el cruce C86-12 x CP70-1133, lo que representa la gestión de datos en dos etapas, tres provincias o territorios (Villa Clara, Holguín y Santiago de Cuba) y tres años o series (2008, 2009 y 2011).

  • a2) Muestra la reacción en pruebas estatales de resistencia de las plagas roya parda, carbón, escaldadura foliar y virus de la caña de azúcar de los cultivares C86-12 y CP70-1133 utilizados como progenitores femenino y masculino, respectivamente. Las categorías de reacción a estas cuatro enfermedades se resumen en: susceptible (S), Intermedia (I) y Resistente (R).

  • a3) Visualiza los resultados de la clasificación del cruce (caso de estudio) almacenado en una base de datos, previa compilación de resultados de selección, aplicación de un modelo matemático o índice simultáneo de selección y algoritmo de clasificación, donde se obtiene el valor genético o clasificación del cruce en ocho categorías (1313. Kumar H, Menakadevi T. A review on big data analytics in the field of agriculture. International Journal of Latest Transactions in Engineering and Science [Internet]. 2017;1(4):1-10. Available from: http://www.ijltes.com/wp-content/uploads/2017/02/1.pdf ): 0-sin evaluación; 1-muy descartada; 2-moderadamente descartada; 3-descartada; 4-exploratorio; 5-moderadamente comprobado; 6-comprobado y 7-muy comprobado. En este caso el cruce C86-12 x CP70-1133 resultó muy comprobado y comprobado en las provincias Villa Clara y Santiago de Cuba, respectivamente y sin evaluación en la provincia Holguín.

  • a4) Refleja los resumes de selección de las siete bases de datos colectadas en cada serie, etapas y territorio en que participó. En la misma se pudo determinar que en el cruce de estudio se plantaron 90 individuos, diez no sobrevivieron, 80 fueron los evaluados, con 14 seleccionados para un 17,5 % de selección. El resto de los individuos fueron eliminados por carbón (7), roya parda (1), bajo brix (1), floración (9), vigor (43) y otras causas (4).

  • b1) En la segunda parte de la tabla se pudo determinar si el cruce pertenece al programa nacional de cruzamiento. En este caso el cruce C86-12 x CP70-1133 está incluido en el programa de cruzamiento (PC).

  • b2) Muestra los resumes de la estadística básica y los parámetros genético-estadísticos realizados a las siete bases de datos colectadas en cada serie, etapas y territorios en que participó. En la misma se pudo determinar la media del brix refractromético, diámetro y longitud de los tallos, así como el número de tallos por plantón. Por otra parte, visualiza el diferencial de selección del cruce en estudio respecto al testigo para cada variable evaluada, lo que evidencia los avances o respuesta a la selección. En este caso resultó un cruce con buenos resultados debido a la mayor parte de los valores positivos del diferencial de selección o muy cercanos a cero alcanzado en todas las variables evaluadas. También se muestra el número de observaciones de donde proceden los valores de las medias de las variables como referencia del tamaño de la muestra.

Tabla 1.  Antecedentes de resultados de selección del cruce C86-12 x CP70-1133 y bases de datos que participan (enfoque de big data)

El modelo de gestión de macrodatos diseñado para procesar el volumen, variabilidad, velocidad y veracidad de los datos que se generan en el programa de selección genética de la caña de azúcar evidencia su potencial en el caso de estudio del cruce C86-12 x CP70-1133. En un espacio de tiempo relativamente breve se accede a toda la información disponible al respecto y posibilita recomendar su mejor manejo.

Muchos países desarrollados han comenzado la aplicación de análisis de datos masivos en la agricultura de precisión e integrado a los métodos tradicionales de producción (1313. Kumar H, Menakadevi T. A review on big data analytics in the field of agriculture. International Journal of Latest Transactions in Engineering and Science [Internet]. 2017;1(4):1-10. Available from: http://www.ijltes.com/wp-content/uploads/2017/02/1.pdf ). Estas aplicaciones se han concentrado en la colección de datos procedentes de sensores en máquinas de alta tecnologías, estaciones automáticas de meteorología e información de satélites para mejorar la eficiencia en el estimado de rendimiento.

La industria azucarera australiana ha reconocido el potencial del enfoque de macrodatos y ha realizado importantes inversiones en esta área de investigación. Estas tecnologías se han incorporado en áreas clave como la agricultura de precisión, el fitomejoramiento y los centros de datos geoespaespaciales para la investigación y la extensión (1414. Everingham Y, Sexton J, Skocaj D, Inman-Bamber G. Accurate prediction of sugarcane yield using a random forest algorithm. Agronomy for sustainable development [Internet]. 2016;36(2):27. Available from: https://link.springer.com/content/pdf/10.1007/s13593-016-0364-z.pdf ).

En los ingenios azucarero de Australia se ha empleado un modelo big data para relacionar las variables meteorológicas con la productividad del cultivo, así como para la predicción del rendimiento (1414. Everingham Y, Sexton J, Skocaj D, Inman-Bamber G. Accurate prediction of sugarcane yield using a random forest algorithm. Agronomy for sustainable development [Internet]. 2016;36(2):27. Available from: https://link.springer.com/content/pdf/10.1007/s13593-016-0364-z.pdf ,1515. Everingham Y, Sexton J, Robson A. A statistical approach for identifying important climatic influences on sugarcane yields. In: Proceedings of the 37th Conference of the Australian Society of Sugar Cane Technologists, 28-30 April 2015, Bundaberg, Queensland, Australia [Internet]. Australian Society of Sugar Cane Technologists; 2015. Available from: https://www.researchgate.net/publication/287208302_A_Statisical_Approach_for_identifying_Important_Climatic_Influences_on_Sugarcane_Yields ). Otro estudio desarrollado en China permitió monitorear y estimar el rendimiento a través del uso de internet de las cosas, tecnologías de sensores y procesamiento de imágenes (1616. Biqing L, Yongfa L, Miao T, Shiyong Z. Design and Implementation of Sugarcane Growth Monitoring System based on RFID and ZigBee. International Journal of Online Engineering [Internet]. 2018;14(3). Available from: https://www.researchgate.net/publication/324114641_Design_and_Implementation_of_Sugarcane_Growth_Monitoring_System_based_on_RFID_and_ZigBee ). Los resultados mostraron que se puede visualizar el crecimiento del cultivo, junto a las variables temperatura y la humedad, de manera que los productores pueden implementar la gestión visual remota y mejorar su eficiencia de producción.

Estas investigaciones y los resultados del presente trabajo respaldan el uso de tecnologías de minería de datos y big data para facilitar la toma de decisiones y contribuir al mejoramiento de la agroindustria azucarera. Lo más importante es que el enfoque descrito en este documento se puede extender fácilmente a otras áreas de investigación del cultivo e industrias agrícolas para recomendar mejores prácticas agrícolas.

CONCLUSIONES

 
  • Se obtuvo un modelo de gestión con un enfoque de macrodatos, asistido por la interface SASEL, para facilitar la toma de decisiones en el Programa de Mejoramiento de la caña de azúcar en Cuba e incrementar la eficiencia de este.

  • A través de este modelo de gestión de información se pudo obtener una compilación de datos primarios, resultados de selección, estimar el valor genético de progenitores y cruces y clasificar los cruzamientos utilizados en el Programa de Mejoramiento.

RECOMENDACIONES

 

Extender el uso del enfoque de macro datos a partir de la compilación de otras fuentes de información que contribuyan a incrementar la eficiencia del programa obtención de nuevos cultivares comerciales.

BIBLIOGRAFÍA

 

1. Sun J, Zhou Z, Bu Y, Zhuo J, Chen Y, Li D. Research and development for potted flowers automated grading system based on internet of things. Journal of Shenyang Agricultural University [Internet]. 2013;44(5):687-91. Available from: https://www.cabdirect.org/cabdirect/abstract/20133406244

2. Yang C. Big Data and its potential applications on agricultural production. Crop, Environment & Bioinformatics [Internet]. 2014;11(1):51-6. Available from: https://www.cabdirect.org/cabdirect/abstract/20143190953

3. Chen M, Mao S, Liu Y. Big data: A survey. Mobile networks and applications [Internet]. 2014;19(2):171-209. Available from: https://dl.acm.org/doi/10.1007/s11036-013-0489-0

4. Mazzocchi F, Lapointe FJ. Sobre el ‘big data’:¿ Cómo podríamos dar sentido a los macrodatos? Mètode: Revista de difusión de la Investigación [Internet]. 2020;1(104):34-41. Available from: https://dialnet.unirioja.es/servlet/articulo?codigo=7391781

5. Wolfert S, Ge L, Verdouw C, Bogaardt M-J. Big data in smart farming-a review. Agricultural systems [Internet]. 2017;153:69-80. Available from: https://www.sciencedirect.com/science/article/pii/S0308521X16303754

6. Park S, Jackson P, Berding N, Inman-Bamber G. Conventional breeding practices within the Australian sugarcane breeding program. In: Proceedings of the Australian Society of Sugar Cane Technologists [Internet]. 2007. p. 113-21. Available from: https://www.researchgate.net/profile/Nils-Berding/publication/305390103_Conventional_breeding_practices_within_the_Australian_sugarcane_breeding_program/links/578c603608ae5c86c9a14e99/Conventional-breeding-practices-within-the-Australian-sugarcane-breeding-program.pdf

7. Yadav S, Jackson P, Wei X, Ross EM, Aitken K, Deomano E, et al. Accelerating genetic gain in sugarcane breeding using genomic selection. Agronomy [Internet]. 2020;10(4):585. Available from: https://www.mdpi.com/2073-4395/10/4/585

8. González R. Variedades de caña de azúcar cultivadas en Cuba. Cronología, legislación, metodologías y conceptos relacionados. Instituto Cubano de Investigaciones de Derivados de La Caña de Azúcar; 2019.

9. Rodríguez R, Puchades Y, Abiche W, Rill S, García H. SASEL: software for data management generated in the Cuban sugarcane-breeding program. In: Proceedings of the International Society of Sugar Cane Technologists. 2016. p. 63-6.

10. Jorge H, González R, Casas M, Jorge I. Normas y procedimientos del programa de mejoramiento genético de la caña de azúcar en Cuba. PUBLINICA, La Habana. 2011;

11. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W, Cornide-Hernández MT. Modelo matemático para estimar el valor genético de progenitores y cruces en caña de azúcar. Cultivos Tropicales [Internet]. 2018;39(2):81-8. Available from: http://scielo.sld.cu/scielo.php?pid=S0258-59362018000200011&script=sci_arttext&tlng=en

12. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W. Metodología de validación y manejo de cruces en la mejora genética en caña de azúcar. Cultivos Tropicales [Internet]. 2020;41(1). Available from: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S0258-59362020000100002

13. Kumar H, Menakadevi T. A review on big data analytics in the field of agriculture. International Journal of Latest Transactions in Engineering and Science [Internet]. 2017;1(4):1-10. Available from: http://www.ijltes.com/wp-content/uploads/2017/02/1.pdf

14. Everingham Y, Sexton J, Skocaj D, Inman-Bamber G. Accurate prediction of sugarcane yield using a random forest algorithm. Agronomy for sustainable development [Internet]. 2016;36(2):27. Available from: https://link.springer.com/content/pdf/10.1007/s13593-016-0364-z.pdf

15. Everingham Y, Sexton J, Robson A. A statistical approach for identifying important climatic influences on sugarcane yields. In: Proceedings of the 37th Conference of the Australian Society of Sugar Cane Technologists, 28-30 April 2015, Bundaberg, Queensland, Australia [Internet]. Australian Society of Sugar Cane Technologists; 2015. Available from: https://www.researchgate.net/publication/287208302_A_Statisical_Approach_for_identifying_Important_Climatic_Influences_on_Sugarcane_Yields

16. Biqing L, Yongfa L, Miao T, Shiyong Z. Design and Implementation of Sugarcane Growth Monitoring System based on RFID and ZigBee. International Journal of Online Engineering [Internet]. 2018;14(3). Available from: https://www.researchgate.net/publication/324114641_Design_and_Implementation_of_Sugarcane_Growth_Monitoring_System_based_on_RFID_and_ZigBee

Cultivos Tropicales Vol. 43, No. 3, julio-septiembre, 2022, ISSN: 1819-4087
 
Original article

Big data management for sugarcane breeding program

 

iDReynaldo Rodríguez-Gross1Estación Territorial de Investigaciones de la Caña de Azúcar Oriente Sur. Cuba*✉:reynaldo.rodriguez@inicasc.azcuba.cu

iDYaquelin Puchades-Isaguirre1Estación Territorial de Investigaciones de la Caña de Azúcar Oriente Sur. Cuba

iDWilfre Aiche-Maceo1Estación Territorial de Investigaciones de la Caña de Azúcar Oriente Sur. Cuba

iDHéctor García-Pérez2Instituto de Investigaciones de la Caña de Azúcar (INICA). Cuba


1Estación Territorial de Investigaciones de la Caña de Azúcar Oriente Sur. Cuba

2Instituto de Investigaciones de la Caña de Azúcar (INICA). Cuba

 

*Author for correspondence: reynaldo.rodriguez@inicasc.azcuba.cu

ABSTRACT

The aim of this work was to design and establish a model of macro data management to facilitate decision-making in the Sugarcane Breeding Program in Cuba and increase its efficiency. For this, available sources of information from the selection process from the period 2000 to 2017 and those coming from the agroproductive response of cultivars in production areas were used. A model was designed and applied that includes components such as: infrastructure, collection, validation, storage, processing, analysis and visualization. A case study of the C86-12 x CP70-1133 cross was conducted to characterize its selection background. As a result, the big data approach made it possible to obtain a compilation of primary data and selection results, estimate the genetic value of parents and crosses, classify the crosses and facilitate decision-making in the sugarcane breeding program in Cuba to obtain new commercial cultivars. Its application in the case study guaranteed access to all available information on the subject and recommending its best management.

Key words: 
hybridization, ICT, statistical methods

INTRODUCTION

 

The use of big data techniques and methods in agriculture is a great opportunity for the use of technologies depending on the investment and the perception of their additional value within the agri-food sector (11. Sun J, Zhou Z, Bu Y, Zhuo J, Chen Y, Li D. Research and development for potted flowers automated grading system based on internet of things. Journal of Shenyang Agricultural University [Internet]. 2013;44(5):687-91. Available from: https://www.cabdirect.org/cabdirect/abstract/20133406244 ,22. Yang C. Big Data and its potential applications on agricultural production. Crop, Environment & Bioinformatics [Internet]. 2014;11(1):51-6. Available from: https://www.cabdirect.org/cabdirect/abstract/20143190953 ). The big data paradigm is recent and plays an important role in improving the efficiency of the entire supply chain and mitigating food safety issues (33. Chen M, Mao S, Liu Y. Big data: A survey. Mobile networks and applications [Internet]. 2014;19(2):171-209. Available from: https://dl.acm.org/doi/10.1007/s11036-013-0489-0 ).

Big data applications in agriculture are not strictly concerned with the primary production of large data sets, but base management tasks on interfacing automated forms of collection and storage with pattern recognition functions (44. Mazzocchi F, Lapointe FJ. Sobre el ‘big data’:¿ Cómo podríamos dar sentido a los macrodatos? Mètode: Revista de difusión de la Investigación [Internet]. 2020;1(104):34-41. Available from: https://dialnet.unirioja.es/servlet/articulo?codigo=7391781 ). While the big data approach takes into account variability in the field, it requires real-time reconfiguration tools to streamline decision-making, and generally includes intelligent assistance in the implementation, maintenance, and use of the technology (55. Wolfert S, Ge L, Verdouw C, Bogaardt M-J. Big data in smart farming-a review. Agricultural systems [Internet]. 2017;153:69-80. Available from: https://www.sciencedirect.com/science/article/pii/S0308521X16303754 ).

Sugarcane breeding programs follow four key steps: (i) the generation of a large progeny population from specific crosses, (ii) the evaluation of those progeny at different stages, (iii) clone selection with superior characteristics, and (iv) recombination of the selected clones to close the cycle, or to initiate a new one. This is a relatively long process (never less than 10 years), which consumes resources and generates a large amount of information that must be summarized in different forms (66. Park S, Jackson P, Berding N, Inman-Bamber G. Conventional breeding practices within the Australian sugarcane breeding program. In: Proceedings of the Australian Society of Sugar Cane Technologists [Internet]. 2007. p. 113-21. Available from: https://www.researchgate.net/profile/Nils-Berding/publication/305390103_Conventional_breeding_practices_within_the_Australian_sugarcane_breeding_program/links/578c603608ae5c86c9a14e99/Conventional-breeding-practices-within-the-Australian-sugarcane-breeding-program.pdf ,77. Yadav S, Jackson P, Wei X, Ross EM, Aitken K, Deomano E, et al. Accelerating genetic gain in sugarcane breeding using genomic selection. Agronomy [Internet]. 2020;10(4):585. Available from: https://www.mdpi.com/2073-4395/10/4/585 ).

The Sugarcane Research Institute of Cuba (INICA) develops a genetic breeding program to respond to the breeding of cultivars (88. González R. Variedades de caña de azúcar cultivadas en Cuba. Cronología, legislación, metodologías y conceptos relacionados. Instituto Cubano de Investigaciones de Derivados de La Caña de Azúcar; 2019.). This implies that it annually handles an extensive volume of data from a large population of clones and cultivars in different selection stages.

To capture, store and process the information obtained in the Sugarcane breeding Program in Cuba, a computer program (SASEL) is available to improve the efficiency of the whole process (99. Rodríguez R, Puchades Y, Abiche W, Rill S, García H. SASEL: software for data management generated in the Cuban sugarcane-breeding program. In: Proceedings of the International Society of Sugar Cane Technologists. 2016. p. 63-6.). In addition to the above, there is information coming from the response of cultivars in production conditions, both yield and reaction to pests, which is not taken into consideration, in a dynamic way, to correct the sugarcane crossing program.

The aim of this work was to design and establish a management model with a macro data approach assisted by the SASEL interface to facilitate decision making in the sugarcane breeding program in Cuba and increase its efficiency.

MATERIALS AND METHODS

 

For the realization of the model of macro data management of the sugarcane-breeding program, the development of its components was taken into account, such as:

Infrastructure and digital security: Breeding Program with a network of test environments (eleven), which are representative of the main conditions in which sugarcane is grown in the country (Figure 1). It is staffed and maintained by seven provincial experimental stations and six extension and agricultural services groups, all of which have the necessary personnel (researchers, technicians and specialists) and equipment (greenhouses, molecular biology, diagnostic, seed, physiology and sugar analysis laboratories). It also has a center exclusively for generating variability through hybridization. This infrastructure ensures the collection of data from both new cultivar studies and those planted in sugarcane production areas.

Figure 1.  Experimental network for the sugarcane breeding program in Cuba

Validation of information: The entire process of genetic breeding (including generation of variability, selection, pest resistance tests, extension in commercial areas) is governed by Standards and Procedures (1010. Jorge H, González R, Casas M, Jorge I. Normas y procedimientos del programa de mejoramiento genético de la caña de azúcar en Cuba. PUBLINICA, La Habana. 2011;), which allow standardizing procedures and structuring the databases of the information generated, auditable by the program management, at the same time that it is validated.

Collection, storage and organization of data: The data have a physical record in the file or protocol of each trial. A computer application called SASEL is available to facilitate its digitalization and management (99. Rodríguez R, Puchades Y, Abiche W, Rill S, García H. SASEL: software for data management generated in the Cuban sugarcane-breeding program. In: Proceedings of the International Society of Sugar Cane Technologists. 2016. p. 63-6.). This application stratifies the information at the provincial level by year of selection or series, combination, stage and strain, and for the national analysis, it adds the province.

Tools for analysis, modeling and visualization: Genetic-statistical parameters such as mean, standard deviation, variance and differential selection are determined for the selection databases, either from a particular series or from compilation in time and space (several series, stages and localities).

In addition to the genetic-statistical parameters, the individual data of crosses of a series or compiled from several series were used to determine an index of simultaneous selection in the estimation of the genetic value (EVG) of crosses and parents (1111. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W, Cornide-Hernández MT. Modelo matemático para estimar el valor genético de progenitores y cruces en caña de azúcar. Cultivos Tropicales [Internet]. 2018;39(2):81-8. Available from: http://scielo.sld.cu/scielo.php?pid=S0258-59362018000200011&script=sci_arttext&tlng=en ). With the EVG values, a cross evaluation methodology was developed to classify crosses from highly proven to highly discard (1212. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W. Metodología de validación y manejo de cruces en la mejora genética en caña de azúcar. Cultivos Tropicales [Internet]. 2020;41(1). Available from: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S0258-59362020000100002 ). These mathematical tools of multivariate analysis were used as a whole to process the chain of big data generated in the breeding process.

For the data visualization and their analysis, the default reports of SASEL interface were used, in addition to the customized queries that can be performed. Moreover, the database relationship model of the SASEL software platform was restructured to a new big data approach that included relational, semi-relational and non-relational databases:

  • Compilation of selection data of primary field from the first and second clonal stage by series and territories.

  • Compilation of field selection results of the first and second clonal stage by series and territories.

  • Estimation of the genetic value of parents and crosses and classification.

Case study. Selection results in the first and second clonal propagation.

 

As an example of the Big-Data approach, a chain of data resulting from the selection process in clonal stages I and II of the current selection scheme was processed. It is corresponding to the progenies obtained in the period 2000-2007, from the biparental cross between the female and male parents respectively C86-12 and CP70-1133, evaluated in the test sites or selection environments corresponding to Villa Clara, Holguin and Santiago de Cuba provinces.

Data universe included 160 806 clones (It does not quite understand the 1738 crosses, unless the participation of the parents C86-12 and CP70-1133 was taken into account within these crosses) processed with the aid of SASEL application that allowed obtaining the summaries of the selection by series and territories.

RESULTS AND DISCUSSION

 

The big data management scheme for the sugarcane breeding program in Cuba takes into account the information generated in the selection process of new cultivars, as well as the evaluations carried out in commercial production areas (Figure 2). This design was based on the integration of relational, semi-relational and non-relational databases.

Figure 2.  Big data management scheme for the sugarcane genetic breeding program in Cuba

The primary information is stored in different databases such as crossbreeding program, evaluations, and field selection and resistance tests. All these determinations are obtained by series or years, breeding site and stages of the selection scheme.

The evaluations of the agro-productive response of cultivars in production areas and percentages of occupied areas, commercial validation tests of new cultivars and phytosanitary surveys are also part of the big data scheme. These databases have between them and the breeding program a relationship that is not always relational or structured; that is, they can be provided in different formats and from different sources.

Big data management allows data to be stored, organized and validated, and then analyzed, modeled and visualized. The core of analysis and processing (Figure 2) is supported by the application of statistical analysis, time and space series analysis, mathematical models and genetic value estimation (1111. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W, Cornide-Hernández MT. Modelo matemático para estimar el valor genético de progenitores y cruces en caña de azúcar. Cultivos Tropicales [Internet]. 2018;39(2):81-8. Available from: http://scielo.sld.cu/scielo.php?pid=S0258-59362018000200011&script=sci_arttext&tlng=en ), as well as cross and parent classification methodologies (1212. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W. Metodología de validación y manejo de cruces en la mejora genética en caña de azúcar. Cultivos Tropicales [Internet]. 2020;41(1). Available from: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S0258-59362020000100002 ). With the results obtained in these analyses, it is facilitated the decision making in the sugarcane breeding program in Cuba, which brings an increase in its efficiency and in cultivar recommendation composition in commercial production areas.

On the other hand, a new option of SASEL interface was obtained for the management and visualization of data in a big data environment (Figure 3). It is important to highlight the four fundamental elements that make it up. Box a1 is composed of the databases with the record of parents and crosses to be processed. This information can come from the crossing or hybridization list, the file of the series in use or manually entered data.

(a1- parent record, a2- information source, a3- data collected or processed, a4- report output)
Figure 3.  Interface for handling and visualization of macrodata

Box a2 and a3 distinguish the source or database from which the information on the selected parents and crosses is obtained, and whether this information is primary or previously processed with the application of statistical analysis and mathematical models. The databases that are integrated in this option are: (i) seedling stage; (ii) clonal batches stage 1 and 2; (iii) replicated studies; (iv) Genetic value of crosses; (v) commercial varieties; and (vii) resistance tests, which include phytosanitary surveys.

Box a4 reveals the type of output and the scope of information consulted. It is possible to perform individual analyses by parent, series, territory or stage, and comprehensive summaries can be obtained. It is in the latter that big data approach is best appreciated, as the information is displayed in summary form, which facilitates understanding and thus decision making.

This interconnection of databases has made it possible to obtain a compilation of results on the number of crosses evaluated by the genetic breeding program, their frequency and results. A mathematical model was also obtained to estimate the genetic value of parents and crosses (1111. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W, Cornide-Hernández MT. Modelo matemático para estimar el valor genético de progenitores y cruces en caña de azúcar. Cultivos Tropicales [Internet]. 2018;39(2):81-8. Available from: http://scielo.sld.cu/scielo.php?pid=S0258-59362018000200011&script=sci_arttext&tlng=en ), and it constitutes the basis of the methodology for the classification of crosses (1212. Rodríguez-Gross R, Puchades-Isaguirre Y, Aiche-Maceo W. Metodología de validación y manejo de cruces en la mejora genética en caña de azúcar. Cultivos Tropicales [Internet]. 2020;41(1). Available from: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S0258-59362020000100002 ). This last result takes into consideration the genotype-environment interaction, which undoubtedly constitutes a valuable tool to increase the efficiency of the breeding program.

The incorporation of new data bases from evaluations in commercial production areas offers the possibility of new outlets to improve the recommendations for cultivar composition and management.

Case study. Background of selection results and genetic value in clonal stages 1 and 2

 

The query performed on the selection background in the databases of clonal batches 1 and 2 of the C86-12 x CP70-1133 cross showed their participation results in the study period of the series from 2000 to 2017 (Table 1). This output is the product of the collection, processing, analysis and interconnection of six data chains:

  • (a1) Data collected in the selection evaluations of clonal stages 1 and 2. In the study period, only seven series were found where the C86-12 x CP70-1133 cross participated, representing data management in two stages, three provinces or territories (Villa Clara, Holguín and Santiago de Cuba) and three years or series (2008, 2009 and 2011).

  • a2). It shows the reaction in state resistance tests for brown rust, charcoal, leaf scald and sugarcane virus pests of C86-12 and CP70-1133 cultivars used as female and male parents, respectively. The reaction categories to these four diseases are summarized as susceptible (S), Intermediate (I) and Resistant (R).

  • a3). It visualizes cross classification results (case study) stored in a database, after compilation of selection results, application of a mathematical model or simultaneous selection index and classification algorithm, where the genetic value or classification of the cross is obtained in eight categories (1313. Kumar H, Menakadevi T. A review on big data analytics in the field of agriculture. International Journal of Latest Transactions in Engineering and Science [Internet]. 2017;1(4):1-10. Available from: http://www.ijltes.com/wp-content/uploads/2017/02/1.pdf ). 0-no evaluation; 1-moderately discarded; 2-moderately discarded; 3-discarded; 4-exploratory; 5-moderately proven; 6-proven and 7-very proven. In this case, the C86-12 x CP70-1133 cross was very proven and proven in Villa Clara and Santiago de Cuba provinces, respectively, and without evaluation in Holguín province.

  • a4). It reflects the selection summaries of the seven databases collected in each series, stages and territory in which it participated. It was possible to determine that 90 individuals were planted in the study crossing, ten did not survive, 80 were evaluated, with 14 selected for a 17.5 % of selection. The rest of individuals were eliminated due to charcoal (7), brown rust (1), low brix (1), flowering (9), vigor (43) and other causes (4).

  • b1). In the second part of the table it was possible to determine if the cross belongs to the national crossing program. In this case, the C86-12 x CP70-1133 cross is included in the crossing program (CP).

  • b2) it shows the summaries of the basic statistics and the genetic-statistical parameters carried out on the seven databases collected in each series, stages and territories in which it participated. The mean refractrometric brix, diameter and length of stems, as well as the number of stems per seedling were determined. On the other hand, it visualizes the selection differential of the cross under study with respect to the control for each variable evaluated, which shows the progress or response to selection. In this case it was a cross with good results due to most of positive values of the differential selection or very close to zero reached in all the variables evaluated. The number of observations from which the mean values of the variables are derived is also shown as a reference of the sample size.

Table 1.  Background of selection results of the C86-12 x CP70-1133 cross and participating databases (big data approach)

The big data management model designed to process the volume, variability, speed and veracity of the data generated in the sugarcane genetic selection program shows its potential in the case study of the C86-12 x CP70-1133 cross. In a relatively short period, all the information available on the subject is accessed and makes it possible to recommend its best management.

Many developed countries have begun the application of massive data analysis in precision agriculture and integrated it into traditional production methods (1313. Kumar H, Menakadevi T. A review on big data analytics in the field of agriculture. International Journal of Latest Transactions in Engineering and Science [Internet]. 2017;1(4):1-10. Available from: http://www.ijltes.com/wp-content/uploads/2017/02/1.pdf ). These applications have focused on data collection from sensors on high-tech machines, automatic weather stations and satellite information to improve efficiency in yield estimation.

The Australian sugar industry has recognized the potential of the big data approach and has invested heavily in this area of research. These technologies have been incorporated into key areas such as precision agriculture, plant breeding, and geospatial data centers for research and extension (1414. Everingham Y, Sexton J, Skocaj D, Inman-Bamber G. Accurate prediction of sugarcane yield using a random forest algorithm. Agronomy for sustainable development [Internet]. 2016;36(2):27. Available from: https://link.springer.com/content/pdf/10.1007/s13593-016-0364-z.pdf ).

In Australian sugar mills, a big data model has been used to relate weather variables to crop productivity, as well as for yield prediction (1414. Everingham Y, Sexton J, Skocaj D, Inman-Bamber G. Accurate prediction of sugarcane yield using a random forest algorithm. Agronomy for sustainable development [Internet]. 2016;36(2):27. Available from: https://link.springer.com/content/pdf/10.1007/s13593-016-0364-z.pdf ,1515. Everingham Y, Sexton J, Robson A. A statistical approach for identifying important climatic influences on sugarcane yields. In: Proceedings of the 37th Conference of the Australian Society of Sugar Cane Technologists, 28-30 April 2015, Bundaberg, Queensland, Australia [Internet]. Australian Society of Sugar Cane Technologists; 2015. Available from: https://www.researchgate.net/publication/287208302_A_Statisical_Approach_for_identifying_Important_Climatic_Influences_on_Sugarcane_Yields ). Another study developed in China allowed monitoring and estimating yield using the internet of things, sensor technologies and image processing (1616. Biqing L, Yongfa L, Miao T, Shiyong Z. Design and Implementation of Sugarcane Growth Monitoring System based on RFID and ZigBee. International Journal of Online Engineering [Internet]. 2018;14(3). Available from: https://www.researchgate.net/publication/324114641_Design_and_Implementation_of_Sugarcane_Growth_Monitoring_System_based_on_RFID_and_ZigBee ). The results showed that crop growth could be visualized, along with temperature and humidity variables, so that growers can implement remote visual management and improve their production efficiency.

This research and the results of the present work support the use of data mining and big data technologies to facilitate decision-making and contribute to the improvement of the sugar agribusiness. Most importantly, the approach described in this paper can be easily extended to other areas of crop research and agricultural industries to recommend better farming practices.

CONCLUSIONS

 
  • A management model was obtained with a macro data approach, assisted by the SASEL interface, to facilitate decision-making in the Sugarcane Breeding Program in Cuba and increase its efficiency.

  • Through this information management model, it was possible to obtain a compilation of primary data, selection results, estimate the genetic value of parents and crosses and classify the crosses used in the Breeding Program.