De la misma manera que ChatGPT entiende el lenguaje humano, un nuevo modelo de IA desarrollado por biólogos computacionales de Columbia captura el lenguaje de las células para predecir con precisión su actividad.

Utilizando un nuevo método de inteligencia artificial, investigadores del Colegio de Médicos y Cirujanos Vagelos de la Universidad de Columbia pueden predecir con precisión la actividad genética dentro de cualquier célula humana, revelando esencialmente el funcionamiento interno de la célula. sistema, descrito en el presente número la naturalezaComprender todo, desde el cáncer hasta las enfermedades genéticas, podría cambiar la forma en que trabajan los científicos.

“Los modelos computacionales predictivos generalizables permiten desentrañar los procesos biológicos de una manera rápida y precisa. Estos métodos pueden realizar de manera eficiente experimentos computacionales a gran escala, fomentando y guiando los enfoques experimentales tradicionales”, dijo Raoul Rabadan, profesor de biología de sistemas y autor principal del estudio. nuevo . papel

Los métodos de investigación tradicionales en biología son buenos para revelar cómo las células realizan sus funciones o responden a las perturbaciones. Pero no pueden predecir cómo funcionan las células o cómo responderán a los cambios, como las mutaciones que causan cáncer.

“Tener la capacidad de predecir con precisión la actividad celular transformará nuestra comprensión de los procesos biológicos fundamentales”, afirmó Rabadan. “Esto transformará la biología de una ciencia que describe procesos aparentemente aleatorios a una que puede predecir los sistemas subyacentes que gobiernan el comportamiento celular”.

En los últimos años, enormes cantidades de datos recopilados de células y modelos de IA más potentes han comenzado a transformar la biología en una ciencia más predictiva. El Premio Nobel de Química 2024 fue otorgado a investigadores por su trabajo innovador utilizando IA para predecir estructuras de proteínas. Pero utilizar métodos de IA para predecir la actividad de genes y proteínas dentro de las células ha resultado más difícil.

Un nuevo método de IA predice la expresión genética en cualquier célula

En el nuevo estudio, Rabadan y sus colegas intentaron utilizar la IA para predecir qué genes están activos en células específicas. Esta información sobre la expresión genética puede indicar a los investigadores la identidad de la célula y cómo realiza sus funciones.

“Los modelos anteriores se han entrenado con datos de tipos de células específicos, generalmente líneas celulares cancerosas o cualquier otra cosa que se parezca poco a las células normales”, dice Rabadan. Xi Fu, un estudiante de posgrado en el laboratorio de Rabadon, decidió adoptar un enfoque diferente para entrenar un modelo de aprendizaje automático con datos de expresión genética de millones de células obtenidas de tejido humano normal. Las entradas consisten en secuencias del genoma y datos que muestran qué partes del genoma son accesibles y expresadas.

El enfoque general es similar a cómo funcionan ChatGPT y otros modelos “fundamentales” populares. Estos sistemas utilizan un conjunto de datos de entrenamiento para identificar las reglas subyacentes, la gramática del idioma, y ​​luego aplican esas reglas inferidas a nuevas situaciones. “Aquí es exactamente lo mismo: aprendemos la gramática en diferentes estados celulares, y luego vamos a un estado particular (podría ser uno enfermo o podría ser un tipo de célula normal) y tratamos de ver qué tan bien podemos predecir patrones a partir de esta información”, dijo Rabadan.

Fu y Rabadan pronto reclutaron a un equipo de colaboradores, incluido el coautor Alejandro Buendía, ahora estudiante de doctorado de Stanford y anteriormente en el laboratorio de Rabadan, y Shentong Mo de Carnegie Mellon, para entrenar y probar el nuevo modelo.

Después de entrenar con datos de más de 1,3 millones de células humanas, el sistema se volvió más preciso que nunca en la predicción de la expresión genética en tipos de células, produciendo resultados que coincidían estrechamente con los datos experimentales.

Nuevos métodos de IA revelan un factor determinante del cáncer pediátrico

A continuación, los investigadores mostraron el poder de su sistema de inteligencia artificial cuando le pidieron que descubriera la biología aún oculta de las células enfermas, en este caso, una forma hereditaria de leucemia pediátrica.

“Estos niños heredaron un gen que cambió, y no estaba claro exactamente qué estaban haciendo estas mutaciones”, dijo Rabadan, quien también codirige el Programa de Investigación de Genómica y Epigenómica del Cáncer en el Centro Integral del Cáncer Herbert Irving de Columbia.

Con la IA, los investigadores predijeron que las mutaciones alteran la interacción entre dos factores de transcripción diferentes que determinan el destino de las células leucémicas. Los experimentos de laboratorio han confirmado las predicciones de la IA. Comprender los efectos de estas mutaciones revela los mecanismos específicos que impulsan la enfermedad.

La IA puede revelar “materia oscura” en los genomas

Los nuevos métodos computacionales permitirán a los investigadores comenzar a explorar el papel de la “materia oscura” del genoma, un término tomado de la cosmología que se refiere a la gran parte del genoma que no codifica genes que se sabe que causan cáncer y otras enfermedades.

“La mayoría de las mutaciones encontradas en pacientes con cáncer se encuentran en las llamadas regiones oscuras del genoma. Estas mutaciones no afectan la función de la proteína y la mayoría permanecen sin descubrir”, dijo Rabadan. La idea es que utilizando estos modelos podamos ver mutaciones e iluminar esa parte del genoma”.

Rabadan ya está trabajando con investigadores de Columbia y otras universidades, explorando una variedad de cánceres, desde el cerebro hasta el cáncer de sangre, aprendiendo la gramática de la regulación en las células normales y cómo las células cambian en el proceso de desarrollo del cáncer.

El trabajo también abre nuevas vías para comprender muchas enfermedades más allá del cáncer e identificar objetivos potenciales para nuevos tratamientos. Al representar mutaciones novedosas en modelos informáticos, los investigadores ahora pueden obtener conocimientos y predicciones más profundos sobre exactamente cómo esas mutaciones afectan a una célula.

Volviendo a otros avances recientes en inteligencia artificial para la biología, Rabadan ve el trabajo como parte de una tendencia importante: “Es realmente una nueva era de la biología que es muy emocionante; transformar la biología en una ciencia predictiva”.

Source link