Sistema de Informacin para el control de la Biodiversidad de Variedades y Caracterizacin del Cultivo de Frijol en Cuba

ARTÍCULO ORIGINAL

 

Sistema de información para el control de la biodiversidad de variedades y caracterización del cultivo de frijol en Cuba

 

Information system for the control of the variety biodiversity and characterization of bean cultivation in Cuba

 

 

Nelson Verdesia-Hernández, Ariel Hernández-Musa, Irina Blanco-Gil, Alexis Lamz-Piedra

Instituto Nacional de Ciencias Agrícolas (INCA), Carretera Tapaste, Km 3½, Gaveta Postal 1. San José de las Lajas, Mayabeque. Cuba. CP 32700.

 

 


RESUMEN

En el Proyecto de Innovación Agropecuaria Local (PIAL) el estudio de la diversidad genética de los bancos de germoplasma de cultivos agrícolas tiene gran importancia para el uso y conservación de los recursos fitogenéticos en el país. La puesta a disposición de los agricultores en Cuba de la más amplia diversidad de especies y variedades de cultivos ha constituido sin dudas uno de sus propósitos básicos. El PIAL no cuenta con un sistema automatizado para el control de los procesos vinculados al eje temático de Diversidad Genética y Tecnológica, la información de la composición de la diversidad se almacena de forma manual, así como el proceso de la evaluación del comportamiento agro-morfológico, a partir de la caracterización de la variabilidad en líneas de frijol común (Phaseolus vulgaris L) sembradas en época tardía. Debido a lo anterior planteado se propone realizar un sistema que automatice el control de información de la biodiversidad agrícola. El diseño del sistema está basado en la metodología RUP y su implementación se realizó mediante herramientas de la plataforma Java. La utilización del sistema facilita el control de información de la biodiversidad agrícola, además de ahorrar recursos y agilizar el trabajo de los investigadores en la búsqueda de variedades de frijol que tengan un mayor rendimiento en todo el año.

Palabras clave: cultivos, diseminación, germoplasma, semillas, software libre.


ABSTRACT

In the Local Agricultural Innovation Project (PIAL according its acronym in Spanish), the study of the genetic diversity of germplasm banks of agricultural crops is of great importance for the use and conservation of plant genetic resources in Cuba. The provision of farmers in Cuba of the widest diversity of species and varieties of crops has been without doubt one of its basic purposes. The PIAL does not have an automated system for the control of the processes linked to the thematic axis of genetic diversity and technology. That is to say, the information of the composition of the diversity is stored manually, as well as the process of assessing the behavior agro-morphology from the characterization of the variability in lines of common bean (Phaseolus vulgaris L) sown in late season. Due to the foregoing raised proposes to carry out a system that will automate the control of information in the agricultural biodiversity. The design of the system is based on the RUP methodology and their implementation was carried out using tools of the Java platform. The use of the system facilitates the control agricultural biodeversity information. In addition of saving resources and streamline the work of the researchers in the search for bean varieties that have better performance out of the whole year.

Key words: crops, disemination, germplasm, seeds, free software.


 

 

INTRODUCCIÓN

El estudio de la diversidad genética de los bancos de germoplasma de cultivos agrícolas tiene gran importancia para el uso y conservación de los recursos fitogenéticos. Conocer y entender la estructura de la diversidad de las variedades locales es vital en la identificación de aquellas poblaciones que deben ser conservadas los lugares óptimos para la colecta del germoplasma, y para el seguimiento de los cambios en los patrones de diversidad en el transcurso de las prácticas de conservación in situ. Esto requiere la caracterización de la diversidad en acervos y bancos genéticos, para ampliar y complementar la caracterización basada en descriptores morfológicos así como marcadores bioquímicos y moleculares. Además, conocer la diversidad disponible permite un uso más eficiente de estos recursos fitogenéticos, pues reconoce fuentes de mejoramiento amplias y diversas, materiales y poblaciones que porten genes para caracteres de interés en la mejora de plantas, lo cual posibilita incorporar la diversidad genética y lograr una mayor ganancia en los caracteres de valor agronómico (1).

La puesta a disposición de los agricultores en Cuba de la más amplia diversidad de especies y variedades de cultivos ha constituido sin dudas uno de los propósitos básicos del PIAL, al igual que la diversificación de los sistemas agrícolas enfocados en el FP (Fitomejoramiento Participativo) en sus inicios y posteriormente el PIAL. Esta práctica mostró en Cuba evidencias de la importancia de la participación activa de los agricultores en la toma de decisiones en torno a la selección, multiplicación, mantenimiento y conservación de los recursos fitogenéticos a nivel local, en muy estrecha colaboración con investigadores del Instituto Nacional de Ciencias Agrícolas (INCA) y otras instituciones de investigación científica y del sector de la educación del país (2).

El gran volumen de información que se maneja para ejecutar los procesos mencionados anteriormente se realiza de forma manual, causando una disminución en la rapidez y eficacia en el manejo de la información al estar ubicados los 95 CDBA (Centro de Diseminación Agrícola de la Biodiversidad) existentes en 28 municipios diferentes y de 10 provincias del país, lo cual dificulta el acceso a la información.

Actualmente el PIAL no cuenta con un sistema automatizado para el control de los procesos vinculados al eje temático de Diversidad Genética y Tecnológica; la composición de la diversidad se almacena de forma manual como el funcionamiento de los CDBA.

Debido a lo anterior planteado se propone realizar un sistema que automatice el funcionamiento de los CDBA en Cuba con el objetivo de controlar la información de la biodiversidad de las variedades de los cultivos y caracterizar las variedades del cultivo de frijol.

Para dar solución al problema descrito se plantea como objetivo desarrollar el sistema "SCIDBA" para propiciar un adecuado control de la información de la biodiversidad de variedades y la caracterización del cultivo frijol.

 

MATERIALES Y MÉTODOS

Las herramientas, tecnologías y metodologías utilizadas para el desarrollo del módulo fueron seleccionadas por el grupo de arquitectura del proyecto, teniendo en cuenta que sean las más adecuadas al trabajo a realizar siguiendo la política del país de migrar a software libre.

Groovy como lenguaje para el desarrollo web

Groovy es un lenguaje de programación orientado a objetos implementados sobre la plataforma Java. Tiene características similares a Python, Ruby, Perl y Smalltalk. La especificación JSR 241 se encarga de su estandarización para una futura inclusión como componente oficial de la plataforma Java (3).

Marco de trabajo Grails

Grails es un marco de trabajo dinámico para el desarrollo de aplicaciones web en la plataforma Java, que sigue los principios Don’t repeat your self (No te repitas) y Convention over configuration (Convención sobre configuración). Grails es algo más que un marco de trabajo Modelo Vista Controlador (MVC), también ofrece capa de persistencia, capa de servicio, contenedor de servlets y gestor de bases de datos. Se sustenta sobre varios marcos de trabajo y librerías Java muy conocidas y probadas como son Spring Framework, Hibernate, Sitemesh, Log4j, Jetty, Hsqldb (4).

Entorno de Desarrollo Integrado (IntelliJ IDEA CE)

IntelliJ IDEA es uno de los mejores IDEs (Integrated Development Environment) para Java, de la mano de JetBrains que siempre tuvo características que no encontramos en otros (Eclipse, NetBeans, entre otros) como el guardado y compilado automático, control de sugerencias y resaltado de código dentro incluso de cadenas, el más inteligente auto-completado de código (5).

Diseñador visual de informes dinámicos

iReport es un diseñador visual de código libre para JasperReports escrito en Java. Es un programa que ayuda a los usuarios y desarrolladores que usan la librería JasperReports para diseñar reportes visualmente. A través de una interfaz rica y simple de usar iReport, provee las funciones más importantes para crear reportes en poco tiempo. iReport puede ayudar a la gente que no conoce la sintaxis XML para generar reportes de JasperReports (6).

Sistemas gestor de base de datos PostgreSQL

Es un sistema de gestión de bases de datos objeto-relacional, distribuido bajo licencia BSD y con su código fuente disponible libremente. Utiliza un modelo cliente/servidor y usa multiprocesos en vez de multihilos para garantizar la estabilidad del sistema. Un fallo en uno de los procesos no afectará el resto y el sistema continuará funcionando. La última serie de producción es la 9.3. Sus características técnicas la hacen una de las bases de datos más potentes y robustas del mercado. Su desarrollo comenzó hace más de 16 años, y durante este tiempo, estabilidad, potencia, robustez, facilidad de administración e implementación de estándares han sido las características que más se han tenido en cuenta durante su desarrollo. PostgreSQL funciona muy bien con grandes cantidades de datos y una alta concurrencia de usuarios accediendo a la vez a el sistema (7).

Entorno para análisis del conocimiento de la Universidad de Waikato

Weka es una colección de algoritmos de aprendizaje automático para tareas de minería de datos. Los algoritmos bien se pueden aplicar directamente a un conjunto de datos o llamados desde su propio código Java. Weka contiene herramientas para los datos pre-procesamiento, clasificación, regresión, algoritmo de agrupamiento, reglas de asociación, y la visualización. También es muy adecuado para el desarrollo de nuevos esquemas de aprendizaje automático, es un software publicado bajo la Licencia Pública General de GNU (8).

Librería JavaScript para mapas interactivos

Leaflet es de fuente abierta una moderna biblioteca JavaScript para mapas interactivos móviles amigables. Es desarrollado por Vladimir Agafonkin con un equipo de dedicados colaboradores.

La biblioteca está diseñada con simplicidad, rendimiento y facilidadde uso en mente. Funciona de manera eficiente a través de todas las principales plataformas de escritorio y móviles de la caja, aprovechando HTML5 y CSS3 en los navegadores modernos sin dejar de ser accesibles (9).

Biblioteca de JavaScript

JQuery es una biblioteca JavaScript que permite simplificar la manera de interactuar con los documentos HTML, manipular el árbol DOM, manejar eventos, desarrollar animaciones y agregar interacción con la técnica AJAX a páginas web. Mucho más simple con un API fácil de usar que funciona a través de una multitud de navegadores. Con una combinación de versatilidad y capacidad de ampliación, jQuery ha cambiado la forma en que millones de personas escriben JavaScript (10).

Descripción del algoritmo a utilizar

El Análisis de componentes principales tiene como finalidad, construir un conjunto de nuevas variables o componentes, con la característica de que en este conjunto la mayor parte de la información o variabilidad inicial va a concentrarse en los primeros ejes o componentes. Este resultado permite a su vez reducir la dimensionalidad del problema, facilitando la caracterización de los elementos de la muestra y la búsqueda de estructuras de correlación entre variables.

Estas nuevas variables o componentes, no son más que combinaciones lineales de las variables originales. Se construyen de forma tal que entre ellas no haya correlación alguna; además, tienen la característica de que cada una presenta varianza máxima, es decir, explica la mayor cantidad posible de información inicial.

Nociones del fundamento matemático

Como en todo método multivariado, se parte de la matriz inicial de datos X:


Así, el elemento ij de la matriz representa el valor observado de la variable j en el individuo i. En este caso, es oportuno señalar que las p variables deben ser de naturaleza continua, puesto que el método trabaja con el coeficiente de correlación de Pearson, diseñado para medir la relación lineal existente entre variables continuas.

A partir de esta matriz se estiman el vector de medias upx1= (u1, u2,..., up) y la matriz de varianzas y covarianzas Epxp por medio de X media px1 y Spxp respectivamente.

El objetivo es encontrar p funciones (Y1, Y2,..., Yp), que se expresan como combinación lineal de las variables originales, las cuales se denominan componentes principales.

Sean:


Así, para hallar Y1, es decir, la primera componente, es necesario encontrar los coeficientes A1j j=1.p, de forma tal que la varianza de Y1 sea máxima, sujeta a la condición:


lo cual asegura la unicidad de la solución.

Para hallar Y2 (segunda componente), es necesario encontrar los coeficientes A2j j=1..p, de forma tal que la covarianza de Y2 con Y1 sea igual a cero; además, debe cumplirse que la varianza de Y2 sea máxima y que:


Nótese que en el caso del cálculo de Y2, se exige una condición más; es por ello, que debe obtenerse que la varianza de Y2 va a ser menor o igual que la varianza de Y1.

Para hallar Y3 (tercera componente), es necesario encontrar los coeficientes A3j j=1..p, de forma tal que la covarianza de Y3 con Y2 y la covarianza de Y3 con Y1 sean ambas iguales a cero. Además, Y3 debe tener varianza máxima y los coeficientes deben cumplir la condición:


Por la misma razón, la varianza de Y3 debe ser menor o igual que la varianza de Y2 y Y1. El resto de las componentes se calculan por el mismo algoritmo, hasta llegar a la componente p.

La solución a este problema se traduce en encontrar los valores y vectores propios de la matriz S de varianzas y covarianzas. Así, por ejemplo, el mayor de los valores propios de S será el valor correspondiente a la varianza de Y1, y su vector propio asociado se identifica con los coeficientes A1j, j=1..p. El segundo valor propio (estableciendo un orden decreciente), será el valor correspondiente a la varianza de Y2 y su vector propio asociado se representa por los coeficientes A2j j=1..p; y así sucesivamente hasta llegar a Yp. Algunos autores ofrecen en detalles la demostración de este resultado (11,12).

Nótese que finalmente las componentes cumplen la propiedad de estar incorrelacionadas y la varianza de la primera va a ser mayor que la de la segunda y así sucesivamente.

La suma de las varianzas de todas las componentes va a ser igual a la traza de la matriz S de varianzas y covarianzas, debido a que estas varianzas no son más que los valores propios. Ahora bien, esta no es más que la suma de las varianzas de las variables originales Xi, i=1..p, ya que estos son los elementos de la diagonal S.

Var(Y1)+Var(Y2)+...+ Var(Yp)=Traza(S)=Var(X1)+Var(X2)+...+Var(Xp)

Es por este resultado, que el Análisis de Componentes Principales puede ser utilizado en la reducción de dimensionalidad, es decir, tratar de explicar con menos componentes la información inicial que se recoge en la matriz inicial de datos X.

Una vez construidas las componentes, se procede al cálculo de la correlación de cada componente con las variables iniciales; este es un paso muy importante, ya que a partir de estas correlaciones, es que se va a tener un criterio para caracterizar los ejes o componentes.

Es oportuno señalar que algunos autores plantean que, en ocasiones, resulta más efectivo en lugar de calcular los valores y vectores propios a partir de la matriz S de varianzas y covarianzas, calcularlos a partir de la matriz de correlaciones. Se plantea que se debe utilizar esta última cuando las variables originales están medidas en diferente escala, ya que a través del cálculo de la matriz de correlaciones se estandarizan los datos (13,14).

 

RESULTADOS Y DISCUSIÓN

El sistema está vinculado directamente al eje temático de Diversidad Genética y Tecnológica del PIAL con el fin de mejorar y facilitar el control de la información de la biodiversidad de variedades y la caracterización del cultivo de frijol en Cuba para ello se basa en la utilización de análisis estadísticos como la media, desviación estándar, coeficiente de variación y la realización de análisis de componentes principales.

El proceso de la evaluación del comportamiento agro-morfológico a partir de la caracterización de la variabilidad en líneas de frijol común (Phaseolus vulgaris L) sembradas en época tardía comienza con la siembra de todas las variedades del mismo en un diseño de “Bloques al Azar”. La evaluación se realiza usando 14 caracteres agromorfológicos que incluyen parámetros fenológicos, morfológicos, rendimiento y sus componentes, y resistencia a la roya (Uromyces appendiculatus). Para evaluar los genotipos se tuvieron en cuenta 14 variables morfoagronómicas, según los descriptores recomendados para la caracterización de genotipos de frijol (Tabla) (15).


Tabla. Variables evaluadas para la evaluación del comportamiento agro-morfológico de líneas de frijol común

Para realizar el proceso de evaluación del comportamiento agro-morfológico del cultivo de frijol se debe seleccionar la opción de Caracterización donde se escoge la variedad a procesar. Una vez seleccionada se muestran el listado de las variedades, además de la opción adicionar una nueva variedad, modificar, eliminar y la opción de análisis (Figura 1).


Figura 1. Caracterización del cultivo de Frijol

Una vez insertado los datos anteriores se muestran los resultados obtenidos después de haber aplicado el algoritmo de Análisis de Componentes Principales (Figura 2), donde los datos que están independientes de la raíz y su valor es mayor o igual a 0,5 son los que tienen mayor correlación entre ellos. En la Figura 3 se muestran las componentes principales en las cuales los valores que se toman son los mayores que 1 y las demás se desechan. Con dichos resultados el investigador o el especialista puede apreciar cuál de las variedades de cultivo de frijol es la correcta para la siembra en épocas tardías.


Figura 2. Matriz de Correlación

Figura 3. Componentes Principales

 

CONCLUSIONES

  • Los diferentes sistemas informáticos existentes no satisfacen las necesidades actuales, por lo que se demostró la necesidad de desarrollar un Sistema de control de la biodiversidad de variedades y caracterización del cultivo de frijol en Cuba apoyar la toma de decisiones.

  • Se analizó, diseñó e implementó el Sistema de control de la información de la biodiversidad de variedades y caracterización del cultivo de frijol en Cuba que permite gestionar de manera eficiente todos los procesos que se llevan a cabo en el grupo de Diversidad agrícola, favoreciendo a la toma de decisiones de los investigadores y especialistas.

  • El algoritmo seleccionado es el correcto por tener ventajas como la velocidad, la cual puede ser considerable cuando se trata de grandes volúmenes de datos.

  • Mediante el uso del Sistema de control de la información de la biodiversidad de variedades y caracterización del cultivo de frijol en Cuba, se demostró que el PIAL tuvo un ahorro económico significativo además de una disminución en los tiempos de procesamiento y aumento de la calidad de trabajo demostrando que el sistema es factible.

 

BIBLIOGRAFÍA

1. Ortiz PHR, Miranda LS, Martínez CM, Ríos LH, Cárdena TRM, de la Fe MCF, et al. La Biodiversidad Agrícola en manos del campesinado cubano. La Habana, Cuba: Ediciones INCA; 2013. 357 p.

2. Ortiz PR, Angarica L, Acosta RR, Guevara HF. Manual de Monitoreo y Evaluación Participativos con enfoque de Género. La Habana, Cuba: Ediciones INCA; 2014. 126 p. (Programa de Innovación Agropecuaria Local, PIAL III).

3. Dickinson J. Grails 1.1 web application development. Packt Publishing Ltd; 2009. 310 p.

4. Layka V, Judd CM, Nusairat JF, Shingler J. Deploying and upgrading grails applications. In: Beginning Groovy, Grails and Griffon. Berkeley, CA: Springer Link; 2013 [cited 2018 Apr 9]. p. 291–303. doi:10.1007/978-1-4302-4807-1_12

5. Contreras C. Manual de Ireport [Internet]. Scribd. [cited 2018 Apr 9]. Available from: https://es.scribd.com/doc/37388195/Manual-de-Ireport

6. Martínez R. Sobre PostgreSQL [Internet]. PostgreSQL-es, Portal en español sobre PostgreSQL,[En línea] Octubre. 2010 [cited 2018 Apr 9]. Available from: www. postgresql-es. org. Sobre PostgreSQL.

7. Weka 3 - Data Mining with Open Source Machine Learning Software in Java [Internet]. WEKA The University of Waikato. [cited 2018 Apr 9]. Available from: https://www.cs.waikato.ac.nz/ml/weka/

8. Agafonkin V. Leaflet-a JavaScript library for interactive maps [Internet]. Online: http://leafletjs. com 2016. Available from: http://mourner.github.io/Leaflet/download.html

9. Cooley WW, Lohnes PR. Multivariate data analysis. Biometrische Zeitschrift. 1971;15(4):364. doi:10.1002/bimj.19730150413

10. Bibeault B, Katz Y, De Rosa A. jQuery in Action, Third Edition. Shelter Island, NY: Manning Publications; 2015. 504 p.

11. Gnanadesikan R. Methods for statistical data analysis of multivariate observations. New York: Wiley; 1977. 311 p.

12. Morrison D. Multivariate Statistics [Internet]. New York: John Wiley and Sons; 1979 [cited 2018 Apr 9]. 414 p. Available from: http://www.multivariatestatistics.org/

13. Varela M. Análisis multivariado de datos. Aplicación a las Ciencias Agrícolas. 1998.

14. Schoonhoven AV, Corrales P. Sistema estándar para la evaluación de germoplasma de frijol. [Internet]. Centro Internacional de Agricultura Tropical (CIAT), Cali, Colombia; 1987. 56 p. Available from: https://cgspace.cgiar.org/handle/10568/69699

15. Lamz Piedra A, Cárdenas Travieso RM, Ortiz Pérez R, Montero Tavera V, Martínez Coca B, de la Fé Montenegro CF, et al. Evaluación del comportamiento agro-morfológico a partir de la caracterización de la variabilidad en líneas de frijol común (Phaseolus vulgaris L.) sembradas en época tardía. Cultivos Tropicales. 2016;37(2):108–14.

 

 

Recibido: 17/06/2017
Aceptado: 19/02/2018

 

 

Nelson Verdesia-Hernández, Instituto Nacional de Ciencias Agrícolas (INCA), Carretera Tapaste, Km 3½, Gaveta Postal 1. San José de las Lajas, Mayabeque. Cuba. CP 32700. Email: nelson@inca.edu.cu

Enlaces refback

  • No hay ningún enlace refback.