Gracias a la inteligencia artificial se han descubierto nuevos antibióticos, una supernova, miles de nuevos materiales, se han revelado secretos arqueológicos como los de las líneas de Nazca y posibles tratamientos genéticos y oncológicos. Sus capacidades no solo se centran en poder analizar una enorme cantidad de datos en un tiempo récord, también es capaz de deducir relaciones y establecer vínculos, probar diferentes estrategias y evaluar las posibilidades de tratamientos y fármacos o modelar el cambio climático en cientos de escenarios distintos y con miles de variables. Pero ahora ha dado un paso más: la inteligencia artificial se ha utilizado para revelar detalles de una rama diversa y fundamental de la vida que vive justo debajo de nuestros pies y en cada rincón del planeta.
Gracias a esta tecnología se han descubierto 161.979 nuevas especies de virus de ARN. Esto fue posible gracias al uso de una herramienta de aprendizaje automático que los científicos creen que mejorará enormemente el mapeo de la vida en la Tierra y podría ayudar en la identificación de muchos millones de virus más que aún no se han caracterizado. De hecho, se cree que hay más virus en nuestro planeta que estrellas en el universo.
Los resultados se han publicado en la revista «Cell» y la investigación la ha realizado un equipo internacional que ha escrito «el estudio de descubrimiento de especies de virus más grande jamás publicado», según un comunicado.
«Se nos ha ofrecido una ventana a una parte de la vida en la Tierra que de otro modo estaría oculta, revelando una biodiversidad notable –explica el líder del estudio, Edwards Holmes–. Se trata del mayor número de nuevas especies de virus descubiertas en un solo estudio, lo que amplía enormemente nuestro conocimiento sobre los virus que viven entre nosotros. Encontrar tantos virus nuevos de una sola vez es asombroso, y es apenas la punta del iceberg, abriendo un mundo de descubrimientos. Hay millones más por descubrir, y podemos aplicar este mismo enfoque para identificar bacterias y parásitos».
Aunque los virus de ARN se asocian comúnmente con enfermedades humanas, también se encuentran en entornos extremos en todo el mundo e incluso pueden desempeñar papeles clave en los ecosistemas globales. En este estudio se los encontró viviendo en la atmósfera, aguas termales y respiraderos hidrotermales.
«El hecho de que los entornos extremos contengan tantos tipos de virus es solo otro ejemplo de su fenomenal diversidad y tenacidad para vivir en los entornos más hostiles, lo que potencialmente nos da pistas sobre cómo surgieron los virus y otras formas de vida elementales», añade Holmes.
Los investigadores construyeron un algoritmo de aprendizaje profundo, LucaProt, para calcular enormes cantidades de datos de secuencias genéticas, incluidos genomas de virus extensos de hasta 47.250 nucleótidos e información genómica compleja para descubrir más de 160.000 virus.
«La gran mayoría de estos virus ya habían sido secuenciados y estaban en bases de datos públicas, pero eran tan divergentes que nadie sabía qué eran –confirma Holmes–. Componían lo que a menudo se conoce como ‘‘materia oscura’’ de secuencia. Nuestro método de IA fue capaz de organizar y categorizar toda esta información dispar, arrojando luz sobre el significado de esta materia oscura por primera vez».
La herramienta de IA fue entrenada para calcular esta «materia oscura» e identificar virus basándose en secuencias y las estructuras secundarias de la proteína que todos los virus de ARN utilizan para replicarse. Esto permitió acelerar significativamente el descubrimiento de virus, que, si se utilizaran métodos tradicionales, requeriría mucho tiempo.
«Solíamos depender de tediosos procesos bioinformáticos para el descubrimiento de virus –afirma Mang Shi, coautor del estudio–, lo que limitaba la diversidad que podíamos explorar. Ahora, tenemos un modelo basado en IA mucho más eficaz que ofrece una sensibilidad y especificidad excepcionales y, al mismo tiempo, nos permite profundizar mucho más en la diversidad viral. Planeamos aplicar este modelo en varias aplicaciones».
«LucaProt representa una integración significativa de la tecnología de IA de vanguardia y la virología, lo que demuestra que la IA puede realizar tareas de exploración biológica de manera eficaz», concluye Zhao-Rong Li, coautor del estudio.
«Esta integración proporciona información valiosa y estímulo para una mayor decodificación de secuencias biológicas y la deconstrucción de sistemas biológicos desde una nueva perspectiva. También continuaremos nuestra investigación en el campo de la IA para la virología», añade.
El siguiente paso es entrenar este método para encontrar aún más ejemplos de esta diversidad.