Investigadores de la USC han desarrollado y publicado un nuevo modelo de inteligencia artificial El método de la naturaleza puede predecir cómo se unirán diferentes proteínas al ADN con precisión en una amplia variedad de proteínas, un avance tecnológico que promete acortar el tiempo necesario para desarrollar nuevos medicamentos y otros tratamientos.
La herramienta, conocida como Deep Predictor of Binding Specificity (DeepPBS), es un modelo geométrico de aprendizaje profundo diseñado para predecir la especificidad de unión proteína-ADN a partir de estructuras complejas proteína-ADN. DPPBS permite a los científicos e investigadores introducir datos estructurales de complejos de proteína y ADN en una herramienta computacional en línea.
“La estructura de los complejos proteína-ADN consiste en proteínas que normalmente se unen a una única secuencia de ADN. Para comprender la regulación genética, es importante tener acceso a la especificidad de unión de las proteínas a cualquier secuencia o región de ADN en el genoma”, dijo Remo Rohs, Profesor de la Facultad de Letras, Artes y Ciencias Dornsife de la USC y presidente fundador del Departamento de Ciencias de Biología Cuantitativa y Computacional. “DPPBS es una herramienta de inteligencia artificial que reemplaza la necesidad de secuenciación de alto rendimiento o experimentos de biología estructural para revelar la especificidad de unión entre proteína y ADN”.
La IA analiza y predice proteínas–estructura del ADN
DeepPBS emplea un modelo geométrico de aprendizaje profundo, un tipo de método de aprendizaje automático que analiza datos utilizando estructuras geométricas. La herramienta de IA fue diseñada para capturar las propiedades químicas y el contexto geométrico de la proteína-ADN para predecir la especificidad de unión.
Utilizando estos datos, DPPBS crea gráficos espaciales que representan la estructura de las proteínas y las relaciones entre las proteínas y la representación del ADN. DPPBS puede predecir especificidades de unión entre diferentes familias de proteínas, a diferencia de muchos métodos existentes que se limitan a una familia de proteínas.
“Es importante que los investigadores tengan un método que funcione universalmente para todas las proteínas y no se limite a una familia de proteínas bien estudiada. Este método nos permite diseñar nuevas proteínas”, dijo Rohs.
Principales avances en la predicción de la estructura de las proteínas.
El campo de la predicción de la estructura de las proteínas ha avanzado rápidamente desde la llegada de AlphaFold de DeepMind, que puede predecir la estructura de las proteínas a partir de la secuencia. Estas herramientas han dado lugar a un aumento de los datos estructurados disponibles para los científicos e investigadores para su análisis. DPPBS trabaja junto con métodos de predicción de estructuras para predecir la especificidad de proteínas sin estructuras experimentales disponibles.
DeepPBS tiene muchas aplicaciones, dijo Rohs. Este nuevo enfoque de investigación podría acelerar el diseño de nuevos fármacos y tratamientos para mutaciones específicas en células cancerosas, además de conducir a nuevos descubrimientos en biología sintética y aplicaciones en la investigación del ARN.
Acerca del estudio: Además de Rohs, otros autores del estudio incluyen a Raktim Mitra de la USC; Jinsen Lee de la USC; Jared Seisendorf de la Universidad de California, San Francisco; Ebei Jiang de la USC; Ari Cohen de la USC; y Tsu-Pei Chiu de la USC; así como Cameron Glasscock de la Universidad de Washington.
Esta investigación fue financiada principalmente por la subvención R35GM130376 de los NIH.