Es fácil pensar en el aprendizaje automático como un fenómeno puramente digital, posible gracias a computadoras y algoritmos que pueden imitar un comportamiento similar al del cerebro.

Pero las primeras máquinas eran analógicas y ahora, un pequeño pero creciente conjunto de investigaciones muestra que los sistemas mecánicos también son capaces de “aprender”. Los físicos de la Universidad de Michigan han proporcionado la última entrada en ese campo.

El equipo de la UM formado por Shuaifeng Li y Xiaoming Mao desarrolló un algoritmo que proporciona un marco matemático sobre cómo funciona el aprendizaje en redes llamadas redes neuronales mecánicas.

“Estamos viendo materiales que pueden aprender y realizar cálculos por sí solos”, afirmó Lee.

Los investigadores demostraron cómo ese algoritmo podría usarse para “entrenar” instrumentos para resolver problemas como la identificación de diferentes especies de plantas de iris. Un día, estos materiales podrían crear estructuras capaces de resolver problemas más avanzados, como alas de avión que optimicen su forma para diferentes condiciones de viento, sin que intervengan humanos ni computadoras para ayudar.

Ese futuro está muy lejos, pero los conocimientos de la nueva investigación de la UM podrían proporcionar una inspiración más inmediata para los investigadores fuera del campo, dijo Lee, un investigador postdoctoral.

El algoritmo se basa en un método llamado retropropagación, que se ha utilizado para el aprendizaje tanto digital como óptico. Debido a la aparente indiferencia del algoritmo hacia cómo se transporta la información, también podría ayudar a abrir nuevas vías de investigación sobre cómo aprenden los sistemas vivos, dijeron los investigadores.

“Estamos viendo el éxito de la teoría de la retropropagación en muchos sistemas físicos”, dijo Lee. “Creo que puede ayudar a los biólogos a comprender cómo funcionan las redes neuronales biológicas en humanos y otras especies”.

Li y Mao, profesores del Departamento de Física de la UM, publicaron su nueva investigación en la revista Nature Communications.

MNN 101

La idea de utilizar objetos físicos en la computación existe desde hace décadas. Pero con los recientes avances en inteligencia artificial, existe un interés creciente en las redes neuronales mecanicistas.

La mayoría de estos avances (y ciertamente los más visibles) se han producido en la tecnología informática. Millones de personas recurren cada semana a chatbots con tecnología de inteligencia artificial, como ChatGPT, en busca de ayuda para escribir correos electrónicos, planificar vacaciones y más.

Este asistente de IA se basa en una red neuronal artificial. Aunque sus funciones son complejas y en gran medida ocultas a la vista, proporcionan una analogía útil para comprender las redes neuronales mecanicistas, dijo Lee.

Cuando se utiliza un chatbot, un usuario escribe un comando de entrada o una pregunta, que es interpretada por un algoritmo de red neuronal que se ejecuta en una red informática con una gran cantidad de potencia de procesamiento. Según lo que ese sistema ha aprendido después de haber estado expuesto a una gran cantidad de datos, genera una respuesta o salida que aparece en la pantalla del usuario.

Una red neuronal mecánica, o MNN, tiene los mismos elementos básicos. Para el estudio de Li y Mao, la entrada era un peso unido a un elemento, que servía como mecanismo de procesamiento. El resultado fue cómo el material cambiaba de forma debido al peso que actuaba sobre él.

“La fuerza son los datos de entrada y el material en sí es como el procesador, y la deformación del material es la salida o respuesta”, dijo Lee.

Para esta investigación, los materiales del “procesador” fueron mallas gomosas impresas en 3D, hechas de pequeños triángulos que forman grandes trapecios. Los materiales aprenden ajustando la rigidez o flexibilidad de partes específicas dentro de esa red.

Para realizar sus aplicaciones futuras, como las alas de los aviones que ajustan sus propiedades sobre la marcha, los MNN deben poder ajustar sus propias piezas. Se están investigando materiales que puedan hacer esto, pero aún no se pueden pedir desde un catálogo.

Entonces Lee modeló este comportamiento imprimiendo nuevas versiones de un procesador con una parte más gruesa o más delgada para obtener la respuesta deseada. La principal contribución del trabajo de Li y Mao es el algoritmo que dicta un elemento de cómo adaptar esas partes.

Cómo entrenar a tu MNN

Aunque las matemáticas detrás de la teoría de la retropropagación son complejas, el concepto en sí es intuitivo, dijo Lee.

Para iniciar el proceso, necesita saber cuál es su entrada y cómo desea que responda el sistema. Luego aplica la entrada y ve cómo la respuesta real difiere de la deseada. Luego, la red toma esa diferencia y la usa para informar cómo cambia para acercarse al resultado deseado en iteraciones posteriores.

Matemáticamente, la diferencia entre la producción real y la producción deseada corresponde a una expresión llamada función de pérdida. Aplica un operador matemático conocido como gradiente a la función de pérdida a la que la red aprende a adaptarse.

Lee demostró que si sabes qué buscar, sus MNN proporcionan esa información.

“Puede mostrarte automáticamente el gradiente”, dijo Lee, quien recibió ayuda de cámaras y códigos de computadora en este estudio. “Es realmente conveniente y realmente eficiente”.

Considere el caso en el que una red consta enteramente de segmentos con igual espesor y rigidez. Si cuelga un peso de un nodo central (el punto donde se unen los segmentos), los nodos vecinos en los lados izquierdo y derecho se moverán hacia abajo en la misma cantidad debido a la simetría del sistema.

Pero supongamos, en cambio, que quisiera crear una red que le diera no sólo una respuesta asimétrica, sino la respuesta más asimétrica. Es decir, quería crear una red que maximizara la diferencia de movimiento entre un nodo a la izquierda y un nodo a la derecha de los pesos.

Li y Mao utilizan su algoritmo y una configuración experimental sencilla para construir la red que proporciona esa solución. (Otra analogía con la biología es que el enfoque sólo se preocupa por lo que hacen las conexiones cercanas, como por ejemplo cómo funcionan las neuronas, dijo Lee).

Yendo un paso más allá, los investigadores también proporcionaron grandes conjuntos de datos de fuerzas de entrada similares a lo que se hace en el aprendizaje automático en las computadoras para entrenar sus MNN.

En un ejemplo de esto, diferentes fuerzas de entrada corresponden a las diferentes formas de los pétalos y hojas de la planta del iris, que definen características que ayudan a diferenciar entre especies. Luego, Lee puede presentar una planta de una especie desconocida en la red entrenada y seleccionarla correctamente.

Y Lee ya está trabajando en desarrollar la complejidad del sistema y los problemas que los MNN pueden resolver utilizando portadores de ondas sonoras.

“Podemos codificar mucha más información en la entrada”, dijo Lee. “Con las ondas sonoras, tienes amplitud, frecuencia y fase que pueden codificar datos”.

Al mismo tiempo, el equipo de la UM está estudiando una amplia clase de redes en materiales, incluidos conjuntos de polímeros y nanopartículas. Con ellos pueden crear nuevos sistemas donde aplicar sus algoritmos y trabajar para lograr máquinas de aprendizaje totalmente autónomas.

Este trabajo fue apoyado por la Oficina de Investigación Naval y el Centro de Sistemas de Partículas Complejos de la Fundación Nacional de Ciencias, o COMPASS.

Source link