Cantidades cada vez mayores de datos requieren almacenamiento, a menudo durante largos períodos de tiempo. Los polímeros sintéticos son una alternativa a los medios de almacenamiento convencionales porque retienen la información almacenada utilizando menos espacio y energía. Sin embargo, la recuperación de datos mediante espectrometría de masas limita la longitud y, por tanto, la capacidad de almacenamiento de las cadenas poliméricas individuales. en el diario Química aplicadaLos investigadores ahora han introducido un método que supera esta limitación y permite el acceso directo a bits específicos sin leer toda la cadena.
Los datos se acumulan continuamente como resultado de transacciones comerciales, monitoreo de procesos, control de calidad o seguimiento de lotes de productos. Almacenar estos datos durante décadas requiere mucho espacio y energía. Para el archivado a largo plazo de grandes cantidades de datos que requieren un acceso poco frecuente, las macromoléculas con una secuencia definida, como el ADN y los polímeros sintéticos, son alternativas atractivas.
Los polímeros sintéticos tienen ventajas sobre el ADN: fácil síntesis, alta densidad de almacenamiento y estabilidad en condiciones duras. Su desventaja es que la información codificada en los polímeros se decodifica mediante espectrometría de masas (MS) o secuenciación de masas en tándem (MS).2) para estos métodos, el tamaño de las moléculas debe ser limitado, lo que limita severamente la capacidad de almacenamiento de cada cadena polimérica. Además, toda la cadena debe decodificarse secuencialmente, bloque por bloque; no se puede acceder directamente a los bits de interés. Es como leer un libro completo en lugar de abrirlo en la página correspondiente. Por el contrario, las largas cadenas de ADN pueden cortarse en trozos de longitud aleatoria, secuenciarse individualmente y luego reconstruirse computacionalmente en la secuencia original.
Kyung Taek Kim, del Departamento de Química de la Universidad Nacional de Seúl (República de Corea) y su equipo han desarrollado un nuevo método mediante el cual se obtienen cadenas poliméricas sintéticas muy largas cuyos pesos moleculares exceden los límites analíticos de MS y MS.2 puede ser decodificado eficientemente. Como demostración, el equipo codificó la dirección de su universidad en ASCII y la tradujo, junto con un código de detección de errores (CRC, un método establecido utilizado para garantizar la integridad de los datos), a un código binario, una secuencia de unos y ceros. Esta secuencia de 512 bits se almacenó en una cadena polimérica hecha de dos monómeros diferentes: ácido láctico para representar los unos y ácido fenilláctico para representar los ceros. A intervalos irregulares también incluyen códigos de fragmentación que contienen ácido mandélico. Cuando se activan químicamente, las cadenas se rompen en esas posiciones. En su demostración, encontraron 18 fragmentos de diferentes tamaños que la EM podía decodificar individualmente.2 Secuenciación
Inicialmente, un software especialmente desarrollado identificó fragmentos basándose en su masa y sus grupos finales, como lo muestran los espectros de MS. Durante la EM2 En el proceso, los iones moleculares previamente medidos se descomponen aún más y estos fragmentos también se analizan. Las piezas se pueden clasificar según la diferencia de masa de las piezas. Con la ayuda de códigos de detección de errores CRC, el software reconstruyó toda la secuencia de la cadena cruzando el límite de longitud de la cadena del polímero.
El equipo pudo decodificar bits interesantes como la palabra “química” en su código de dirección sin secuenciar toda la cadena del polímero (acceso aleatorio). Teniendo en cuenta que las partes de sus direcciones están en un orden determinado (departamento, institución, ciudad, código postal, país) y separadas por comas, pudieron aislar el lugar donde se almacenaba la información deseada en la cadena y solo el fragmento relevante. secuencia.