Daniel Reyes es técnico superior del Instituto Tecnológico de Canarias (ITC). Como bioinformático del proyecto, su papel dentro de NEXTGENDEM consiste en escuchar las necesidades y requisitos tecnológicos de los biólogos para ponerlos en la plataforma. También realiza procesos bioinformáticos junto con Antonio Díaz Pérez, genetista de GESPLAN, optimizando y verificando todo el proceso para que cumpla las exigencias de los biólogos.
–¿Cómo entraste en el ITC y en el proyecto NEXTGENDEM?
-Yo estudié Ingeniería Informática en la Universidad Politécnica de Madrid, y justo antes de decidir qué máster estudiar, busqué salidas relacionadas con bioinformática o biología computacional. El ITC era una de las posibilidades, así que contacté con ellos por correo para ver si habría proyectos o salidas para el máster en Biología Computacional que quería estudiar y me dijeron que sí, y era NEXTGENDEM, que me apuntara y que cuando lo terminara les avisara, y que si pasaba las pruebas me cogían. Terminé el máster y después de un año y medio, entré aquí.
–Cuando empezaste con el proyecto, ¿qué necesidades tenía?, ¿cómo te enfrentaste a ello y a los problemas que han ido surgiendo?
-Lo que NEXTGENDEM necesita de mí es quitar cualquier tipo de problemática o conflicto tecnológico a la hora de ejecutar procesos bioinformáticos. Estos son herramientas que se pueden descargar de internet y ejecutar, el problema es que tienen una configuración bastante compleja y necesitan de servidores bastante potentes para poderse utilizar.
Así que lo primero que hice fue hacer un pipeline, que es una especie de cadena de montaje en la cual se pueden ejecutar estos procesos de manera muy sencilla desde la página web, e importar ficheros de input. Eso se pasa a un servidor o software computador, se ejecuta el algoritmo allí, y después se traen los resultados y se suben a la base de datos. Esa fue la primera parte.
La dificultad que me encontré es que la bioinformática todavía lleva poco tiempo, de hecho, el máster que hice fue el primero que se cursó en la Universidad Politécnica de Madrid. Entonces te encuentras con que todo es muy heterogéneo, no hay ningún estándar de casi nada, hay muchos tipos de ficheros diferentes, muchos softwares diferentes que hacen lo mismo… no sabes muy bien cuál utilizar o hacer, y si intentas compartir datos entre diferentes organismos, no lo tienen en el mismo formato, así que intenté hacer que ese pipeline fuera lo más flexible posible para que pudiera adaptarse a cualquier cosa.
La segunda dificultad fue que, aunque estudié el máster en Biología Molecular, yo tengo un background informático, así que las reuniones que tuve con los biólogos para intentar entenderlos y saber qué era lo que necesitaban para después poderlo implementar, fueron bastante complicadas. Pero después de todo el tiempo que ha pasado, ahora sí que nos comprendemos totalmente y han validado todas las ideas e implementaciones que hemos hecho.
También hemos implementado los softwares, que ha tenido unas tres fases de iteración. Una ha sido que los biólogos puedan utilizar desde la página web todos los programas que utilizaban antes pero que eran bastante antiguos, porque tenían unos 15 años. Después, junto con el genetista, elegimos otros que eran bastante más modernos y que también funcionan ya en la página web. Y al final ya hemos conseguido otros programas, así como optimizar ciertas cosas para estar en el estado del arte.
Es decir, hemos pasado de programas que se utilizaban hace 13 años a otros que son más modernos, lo que pasa con la tecnología es que mientras más se usa y más conocida sea, normalmente más tiempo lleva en el mercado y también es más fácil de utilizar. En resumen, pasamos de esos viejos a unos más modernos que estaban ampliamente distribuidos, y que todo el mundo conocía. Y una vez terminamos, fuimos a los del estado del arte, que ya son con artículos científicos, las configuraciones ya no son tan fáciles ni es tan fácil de encontrar, sino que tienes que buscar, leer de diferentes artículos científicos, saber cuál es mejor y cuál es peor, hacer pruebas y verificar que lo que dice hacer lo hace, porque a veces son experimentales y no sirven para lo que tú quieres. Esa es la última etapa en la que estamos y que estamos terminando ya.
–¿Se plantea utilizar este sistema para otros proyectos aparte de NEXTGENDEM?
-Todo este pipeline de ejecución de procesos en otros servidores o supercomputadores es general para cualquier otro campo, es decir, se transfiere un fichero al servidor y ese fichero puede ser de cualquier tipo de naturaleza o cualquier tipo de dominio: geográfico, de astronomía, economía, turismo… de cualquier tipo.
El proceso que se ejecute es un software que puede hacer o descargar cualquiera, y puede ser de economía, de bioinformática o de cualquier otra índole. Y después de volverlo a traer para descargarlo desde la página web, también es lo mismo, es un fichero que puede ser de cualquier naturaleza, en ese aspecto es genérico.
Los procesos que hemos implementado dentro de la herramienta son todos de bioinformática, pero podría ser que fuera de otro tipo de dominio.
–¿Cuál es el estatus en el que se encuentra el programa?
-Como te dije, ha habido tres fases. Está la fase del software antiguo, que ya está completamente funcional. Está el software medianamente moderno, que también está completamente funcional. Y después está el del estado del arte, en el que Antonio Díaz Pérez (genetista de GESPLAN) ya está haciendo pruebas junto con el equipo del Departamento de Biodiversidad Molecular del Jardín Canario, pero tenemos todos los softwares localizados y sabemos qué programas queremos utilizar. Ahora estamos optimizando el rendimiento para que vaya más rápido.
También hemos utilizado muchos parámetros y sacado un montón de gráficas intentando comprobar que hace lo que nosotros queremos y que funciona mejor que el anterior. Y hay un software de alineamiento de secuencias que está validado y que se va a implementar ya. Después el de árboles filogenéticos, que es el del estado del arte, también está ya implementado y funcional. Y falta uno de biodiversidad que todavía falta por experimentar y ver que funciona como los investigadores dicen que funciona.
–¿Ya está a punto de estar listo?
-Ya hemos hecho las primeras pruebas y está todo funcional, falta hacer la prueba de concepto, ya que los biólogos todavía no lo han utilizado demasiado. Teníamos el concepto hecho junto con el genetista, que también es bioinformático, y hemos llevado a cabo una prueba de concepto junto con los informáticos, pero ahora falta que esa prueba de concepto, los campos que tiene la interfaz, les funcione a los biólogos, les guste y estén bien escritos, o ver si no los entienden, si quieren poner otro tipo de letra, o poner los menús en otro lado. Es diseño web, usabilidad, y esperamos que les funcione.
–¿Qué futuras aplicaciones se pueden tener con este sistema?
-Todos estos procesos los vamos a utilizar para la conservación de especies en Canarias. Este proyecto también tiene herramientas geográficas que pueden ser trasladadas a cualquier tipo de geografía, no solamente isleña, sino que también puede ser en Alemania, por ejemplo. Si tienes una base de datos como tenemos en Gran Canaria, en la que tenemos dividida la isla en cuadrículas de 500 por 500 metros, y tienes qué especies están allí, las características geográficas y climáticas del territorio y las muestras de ADN de cada una de las especies, este programa tal cual está, sin cambiar absolutamente nada, se puede exportar a cualquier región. Como es un proyecto europeo, se puede utilizar en toda Europa, pero también se podría utilizar en Estados Unidos, en Sudamérica o en cualquier otro lugar.
Con NEXTGENDEM tienes un control completamente basado en datos objetivos de la biodiversidad que hay en ese territorio, algo que hasta ahora no se ha podido hacer porque cuando no tienes ADN dependes mucho de los taxónomos, aunque hacen un muy buen trabajo diferenciando las especies por sus características morfológicas, etc.
Con los datos geográficos que tenemos podemos hacer previsiones de cómo va a ser el cambio climático, ver qué especies y con qué tipo de ADN viven, en qué regiones y con qué altitud, clima, precipitaciones, temperaturas, etc. Podemos hacer un estudio objetivo de cómo va a afectar el cambio climático a esas especies. Si necesitan cierta temperatura y sabemos que en esa zona va a aumentar por el cambio climático, sabemos objetivamente que a esa especie le va a afectar. Y si es una especie además muy localizada, que solamente vive en ese sitio, sabemos que probablemente tienda a extinguirse.
Podemos hacer muchos análisis, incluso dentro del campo de la ecología, para elaborar planes de acción para mejorar el estado de conservación de la biodiversidad endémica, y trasladarlos a los gestores y políticos. Esa es la utilidad de la herramienta.