Debora Marcone es epidemióloga molecular de virus respiratorios. Parte de su trabajo implica detectar qué tipos de virus de influenza circulan en determinado momento en alguna región. Hasta el momento, el método para saberlo era hacer lo que se denomina “análilsis de filogenia”, que demanda mucho tiempo y requiere capacidades informáticas más complejas que las que suele tener una computadora estándar. Ahora, también cuenta con INFINITy, una herramienta bioinformática basada en machine learning e inteligencia artificial, que desarrolló junto con su colega Marco Cacciabue, investigador del CONICET en la Universidad Nacional de Luján (UNLu) y del Instituto de Agrobiotecnología y Biología Molecular (IABIMO, CONICET-INTA).
INFINITy es una aplicación de acceso libre, destinada a bioquímicos, estudiantes, investigadores y laboratorios de referencia o investigación que permite clasificar secuencias de virus influenza A y B obtenidas de personas que cursaron la enfermedad, de forma rápida y precisa, con más de un 99% de precisión.
“El estudio de los genomas virales es relevante para determinar si han aparecido nuevas variantes, además de monitorear las existentes, si los métodos diagnósticos siguen siendo adecuados para su detección, e incluso, reformular la composición de las vacunas cuando es necesario”, afirma Marcone, que se desempeña en el Instituto de Investigaciones en Bacteriología y Virología Molecular (IBaViM) de la Facultad de Farmacia y Bioquímica de la UBA, y explica que estos virus tienen una gran capacidad de mutar su genoma. Así, los cambios que se van produciendo y acumulando dan origen a nuevas variantes.
El virus de influenza A (H1N1), por ejemplo, sufrió grandes cambios en su genoma y en el año 2009 provocó una pandemia que afectó a infectó a miles de personas en todo el mundo. Desde entonces, los subtipos de influenza A (H1N1) pmd09 y A(H3N2) y dos linajes de influenza B, Victoria y Yamagata, han sido responsables de la mayoría de los casos.
Cuando irrumpió la pandemia por COVID-19, Marcone dejó en pausa su investigación en influenza para abocarse al Sars-Cov-2. Así se conocieron con Cacciabue, que en aquel momento estaba desarrollando una herramienta informática similar pero subtipificar las distintas especies de este último virus, bautizada Covidex. Cuando la urgencia que provocó la pandemia disminuyó, ambos investigadores se pusieron de acuerdo y empezaron a trabajar en esta nueva idea.
Tras un año de trabajo en conjunto, y con el apoyo de la Agencia I+D+i, lograron lanzar INFINITy. “La aplicación está basada en una herramienta similar a la que desarrollamos para COVID pero, en este caso, además de los modelos de clasificación actualizados para secuencias de influenza, hemos logrado mejorar varios aspectos del software para que cumpla con diversos estándares de calidad”, explica Cacciabue. La aplicación está escrita en el lenguaje de programación R, de código abierto, y otros paquetes de programación.
“Lo más desafiante fue lograr una herramienta robusta en cuanto a asegurar su correcto funcionamiento, y que al mismo tiempo sea fácil de usar”, afirma Cacciabue, y destaca que se puede utilizar en diversos formatos: a través de Internet, ya que cuentan con un servidor en la UNLu adonde está alojada toda la información; o de manera local, ya que quien lo desee puede descargar la aplicación en su computadora.
INFINITy cuenta con dos modelos: uno se denomina FULL HA, que permite clasificar secuencias del gen de la proteína viral “hemaglutinina”; y el otro se llama “HA1”, para clasificar las secuencias del gen de su región parcial HA1. Ambas regiones genómicas son usualmente utilizadas a nivel mundial para realizar estudios de epidemiología y vigilancia epidemiológica.
Para testear su funcionamiento, los investigadores la pusieron a prueba utilizando secuencias virales de influenza provenientes de todo el mundo, descargadas de una base de datos de secuencias públicas llamada GISAID. Los resultados y el funcionamiento de la aplicación fueron publicados en una de las revistas científicas más prestigiosas del área, Influenza and other respiratory viruses.
“Para ambos modelos, tanto la hemoglutinada completa como la región parcial HA1, que se puede clasificar, la precisión fue mayor al 99%”, dice Marcone, y destaca que eso los alentó a terminar el desarrollo y publicarlo. “Durante la revisión del paper, un investigador contrastó la herramienta con su base de 50.000 secuencias y le dio una precisión mayor al 95%. Eso nos puso todavía más contentos, ya que demuestra que no sólo funciona para nosotros sino también para cualquier persona que quiera utilizarla”, concluye Marcone.
Con información de la Agencia TSS