Una colaboración de investigación ha lanzado un modelo pionero impulsado por inteligencia artificial (IA) capaz de comprender los patrones de secuencia y estructura que conforman el “lenguaje” genético de las plantas.

Plant RNA-FM, que se cree que es el primer modelo de IA de este tipo, se desarrolló mediante una colaboración entre investigadores de plantas del Centro John Innes e informáticos de la Universidad de Exeter.

El modelo, dicen sus creadores, es un avance tecnológico inteligente que podría impulsar el descubrimiento y la innovación en la ciencia vegetal y potencialmente en el estudio de invertebrados y bacterias.

El ARN, al igual que su conocido pariente químico el ADN, es una molécula importante en todos los organismos, responsable de transportar la información genética en su secuencia y estructura. La arquitectura del ARN en el genoma está formada por bloques de construcción llamados nucleótidos, que están dispuestos en patrones similares a cómo se combinan los alfabetos para formar las palabras y frases del lenguaje.

El grupo del profesor Iliang Ding del Centro John Innes estudia la estructura del ARN, uno de los principales lenguajes de la molécula de ARN donde los ARN pueden plegarse en estructuras complejas que controlan funciones biológicas sofisticadas como el crecimiento de las plantas y la respuesta al estrés.

Para comprender mejor el complejo lenguaje del ARN en sus funciones, el grupo del profesor Ding colaboró ​​con el grupo de la Dra. Kay Lee en la Universidad de Exeter.

Juntos desarrollaron PlantRNA-FM, un modelo entrenado con un conjunto de datos masivo de 54 mil millones de piezas de información de ARN que crea un alfabeto genético en 1.124 especies de plantas.

Mientras desarrollaban PlantRNA-FM, los investigadores siguieron el enfoque en el que los modelos de IA como ChatGPT se entrenan para comprender el lenguaje humano. Al modelo de IA se le enseñó un lenguaje basado en plantas mediante el estudio de datos de ARN de especies de plantas de todo el mundo, para brindarle una visión integral de cómo funciona el ARN en todo el reino vegetal.

Así como ChatGPT puede comprender y responder al lenguaje humano, PlantRNA-FM ha aprendido a comprender la gramática y la lógica de las secuencias y estructuras del ARN.

Los investigadores ya han utilizado el modelo para hacer predicciones específicas sobre la función del ARN e identificar patrones estructurales funcionales específicos del ARN en todo el transcriptoma. Sus predicciones han sido verificadas mediante experimentos que confirman que la estructura del ARN identificada por PlantRNA-FM afecta la eficiencia de la traducción de la información genética en proteínas.

“Aunque las secuencias de ARN pueden parecer aleatorias para el ojo humano, nuestro modelo de IA aprende a decodificar los patrones ocultos dentro de ellas”, dijo el Dr. Haopeng Yu, investigador postdoctoral en el grupo del profesor Yiliang Ding del Centro John Innes.

Esta exitosa colaboración también contó con el apoyo de científicos de la Universidad Normal del Noreste y la Academia China de Ciencias de China que contribuyó a este trabajo.

El profesor Ding dijo: “Nuestro PlantRNA-FM es solo el comienzo. Estamos trabajando estrechamente con el grupo del Dr. Li para desarrollar métodos de inteligencia artificial más avanzados para comprender el lenguaje de ADN y ARN oculto en la naturaleza. Este progreso abre nuevas posibilidades para comprender y potencialmente programar “Esto podría tener profundas implicaciones para la mejora de los cultivos y la próxima generación de diseño de genes basado en IA para ayudar a los científicos de plantas a abordar desafíos que van desde alimentar a una población mundial en crecimiento hasta desarrollar cultivos que puedan prosperar en un clima cambiante. Útil.”

“Un modelo básico de ARN interpretable para explorar motivos de ARN funcionales en plantas” aparece en La naturaleza es inteligencia de máquina.

Source link