Cada habitación de su cuerpo tiene la misma secuencia genética, pero cada célula revela un subconjunto de esos genes. Estas expresiones genéticas específicas de células, que aseguran que las células cerebrales estén separadas de las células de la piel, parcialmente determinadas por la estructura tridimensional del material genético, que controla la accesibilidad de cada gen.

Los químicos del MIT ahora han creado una nueva forma de determinar esta estructura del genoma 3D utilizando inteligencia artificial del generador. Su técnica puede predecir miles de estructuras en cuestión de minutos, lo hace mucho más rápido que el método experimental existente para el análisis de la estructura.

Al usar esta técnica, los investigadores pueden estudiar fácilmente cómo la compañía 3D del genoma afecta las manifestaciones y funciones de los genes de las células individuales.

“Nuestro objetivo era tratar de predecir la estructura del genoma tridimensional de la secuencia de ADN subyacente”, dijo Bin Jang, una subsidiaria de Química y autor principal de la investigación. “Ahora que podemos hacerlo, lo que hace que esta técnica sea igual a las técnicas experimentales de vanguardia, puede exponer abiertamente muchas oportunidades interesantes”.

El graduado del MIT, Greg Shuette y Zhuhan Lao, son los mejores autores del papel, que está presente hoy El progreso de la cienciaEl

Del orden a la estructura

Dentro del núcleo de la célula, el ADN y las proteínas forman un complejo llamado cromatina, que tiene diferentes niveles de organizaciones, lo que permite que las células agrupen 2 metros de ADN en un núcleo, que es solo el cien por ciento del diámetro de un milímetro. Los largos hilos de aire de ADN alrededor de la proteína llamada histona dan lugar a una estructura de algo en una cuerda.

Las etiquetas químicas, conocidas como cambios epignéticos, pueden conectarse al ADN en ciertos lugares, y estas etiquetas, que varían según el tipo de celda, afectan el plegamiento de la cromatina y la accesibilidad de los genes más cercanos. Estas diferencias en las conformaciones de cromatina ayudan a determinar qué genes se publican en diferentes tipos de células o células proporcionadas en diferentes momentos.

En los últimos 20 años, los científicos han creado técnicas experimentales para determinar la estructura de la cromatina. Una técnica ampliamente utilizada, conocida como HI-C, funciona conectando el hilo de ADN vecino en el núcleo de la célula. Los investigadores pueden determinar qué categorías se encuentran entre sí, secuenciando el ADN en muchas piezas pequeñas.

Este método se puede usar en células grandes en células individuales para calcular la estructura promedio para una sección de cromatina o para determinar la estructura en ciertas células. Sin embargo, las técnicas HI-C y similares son intensivas en mano de obra y puede llevar aproximadamente una semana producir datos de una celda.

Para superar estas limitaciones, los muslos y sus alumnos han creado un modelo que aprovecha el reciente progreso de la IA del generador para crear una forma rápida y correcta de predecir la estructura de la cromatina en células individuales. El modelo de IA que diseñaron puede analizar rápidamente secuencias de ADN y predecir las estructuras de cromatina que pueden producir esas secuencias en cualquier célula.

“El patrón de educación profunda es realmente bueno en el reconocimiento”, dice Jang. “Nos permite analizar las categorías de ADN muy largas, miles de pares de bases y determinar cuál es la información importante codificada en esas articulaciones base de ADN”.

El cromógeno, el modelo que crearon los investigadores, tienen dos elementos. El primer elemento, un modelo de educación profunda, se le enseñó a “leer” el genoma, analizó la información codificada en la secuencia de ADN subyacente y los datos de accesibilidad de cromatina, que está ampliamente disponible y específica de tipo celular.

El segundo elemento es un modelo de IA generador que predice las conformaciones correctas de la cromatina físicamente, entrenadas en más de 11 millones de conformaciones de cromatina. Esta información se generó a partir de pruebas utilizando DIP-C (variante de HI-C) en 16 células de una línea de linfocitos B humanos.

Al integrar, el primer elemento informa al modelo de generador cómo el entorno específico del tipo de célula afecta la formación de diversas estructuras de cromatina y este esquema captura efectivamente las relaciones de estructura de secuencia. Para cada jerarquía, los investigadores usan su modelo para crear muchas estructuras posibles. Esto se debe a que el ADN es una molécula muy caótica, por lo que una secuencia de ADN única puede conducir a diversas transformaciones posibles.

“Una de las principales complicaciones de la predicción de la estructura del genoma es que no hay una solución única que apuntemos a que la distribución compleja de estadísticas de alta dimensión compleja es algo increíblemente desafiante”, dijo el Dry.

Análisis más rápido

Una vez entrenado, el modelo puede hacer predicciones en la escala de tiempo mucho más rápido que las técnicas experimentales de alta C u otras.

“Donde puede pasar unos meses de prueba el tipo de células proporcionadas durante seis meses, solo puede crear mil estructuras en una determinada región con nuestro modelo en 20 minutos en una GPU”, dijo la detest.

Después de entrenar su modelo, los investigadores lo usaron para predecir la estructura para más de 2,000 secuencias de ADN, luego las compararon con la estructura determinada experimentalmente para esas secuencias. Descubrieron que las estructuras producidas por el modelo eran las mismas o muy similares a los datos experimentales.

“Por lo general, vemos unos pocos cientos o miles de conformaciones para cada jerarquía, y le da una presentación razonable de una estructura de región específica”, dice Jang. “Si repite su prueba varias veces, en diferentes celdas, probablemente terminará con conformaciones muy diferentes que intentan predecir nuestro modelo”

Los investigadores también encontraron que el modelo podría hacer la predicción correcta para el tipo de tipos de células, excepto que el modelo estaba entrenado. Sugiere que las estructuras de cromatina pueden ser efectivas para analizar el tipo de células y cómo estas diferencias afectan su efectividad. El modelo también se puede utilizar para explorar diferentes estados de cromatina que pueden existir en una sola célula y cómo estos cambios afectan la expresión de genes.

Otra posible aplicación es cómo cambiar la conversión de la cromatina a una secuencia de ADN particular, que puede centrarse en cómo estas conversaciones nacionales pueden causar la enfermedad.

“Hay muchas preguntas interesantes que creo que podemos agregar a este tipo de modelo”, dijo Jang.

Los investigadores han puesto a disposición todos sus datos y modelo para otros que desean usarlos.

La investigación fue financiada por los Institutos Nacionales de Salud.

Source link