causa y efecto. Entendemos este concepto desde la infancia. Tira de la cuerda de un juguete y el juguete lo sigue. Naturalmente, a medida que un sistema crece, el número de variables aumenta y el ruido entra en escena, las cosas se vuelven más complicadas. Finalmente, puede resultar casi imposible saber si una variable está provocando un efecto o simplemente está correlacionada o asociada con él.
Consideremos un ejemplo de la ciencia climática. Los expertos que estudian los patrones de circulación atmosférica a gran escala y sus efectos en el clima global quieren saber cómo estos sistemas podrían cambiar con el calentamiento. Aquí entran en juego muchas variables: temperatura y presión del aire y del océano, corrientes oceánicas y profundidad, e incluso los detalles de la rotación de la Tierra a lo largo del tiempo. Pero, ¿qué variables causan efectos mensurables?
Allí la teoría de la información aparece como marco para la formación causal. Adrian Lozano-Duran, profesor asociado de aeroespacial en Caltech, y miembros de su grupo tanto en Caltech como en el MIT han desarrollado un método que puede usarse para determinar la causalidad incluso en sistemas tan complejos.
La nueva herramienta matemática puede descubrir las contribuciones que cada variable de un sistema hace a un efecto medido, tanto individualmente como, lo que es más importante, en combinación. El equipo describe su nuevo método, llamado descomposición de causalidad sinérgica-única-redundante (SURD), en un artículo publicado hoy 1 de noviembre en la revista comunicación de la naturaleza.
El nuevo modelo se puede utilizar en cualquier situación en la que los científicos intenten determinar la verdadera causa o causas de un efecto medido. Desde el inicio de la crisis bursátil en 2008 hasta la contribución de diversos factores de riesgo a la insuficiencia cardíaca, qué variables marinas afectan a la población de determinadas especies de peces, qué propiedades mecánicas son responsables de la insuficiencia de un pez. material
“La inferencia causal es muy multidisciplinaria y tiene el potencial de impulsar el progreso en muchos campos”, dijo Álvaro Martínez-Sánchez, estudiante de posgrado en el MIT en el grupo de Lozano-Durán, autor principal del nuevo artículo.
Para el grupo de Lozano-Durán, SURD será de gran utilidad en el diseño de sistemas espaciales. Por ejemplo, al identificar qué variables aumentan la resistencia de un avión, el método puede ayudar a los ingenieros a optimizar el diseño del vehículo.
“Los métodos anteriores sólo indicaban en qué medida la causalidad proviene de una variable u otra”, explica Lozano-Duran. “Lo que es único de nuestro método es la capacidad de capturar una imagen completa de todo lo que está causando un efecto”.
El nuevo método también evita la identificación errónea de la causa. Esto se debe en gran medida a que va más allá de cuantificar el efecto que produce cada variable de forma independiente. Además de lo que los autores denominan “causalidad única”, este enfoque incorpora dos nuevas categorías de causalidad, a saber, causalidad redundante y sinérgica.
La causalidad redundante ocurre cuando más de una variable produce un efecto medido, pero no es necesario que todas las variables alcancen el mismo resultado. Por ejemplo, un estudiante puede obtener una buena calificación en una clase porque es muy inteligente o porque es muy trabajador. Ambos pueden sacar buenas notas, pero sólo uno es necesario. Dos variables son redundantes.
Por otro lado, la causalidad sinérgica implica múltiples variables que deben trabajar juntas para producir un efecto. No todas las variables producirán el mismo resultado por sí solas. Por ejemplo, un paciente toma el medicamento A, pero no se recupera de su enfermedad. De manera similar, cuando toma el medicamento B, no ve ninguna mejora. Pero cuando tomó ambos medicamentos se recuperó por completo. Los fármacos A y B son sinérgicos.
SURD descompone matemáticamente las contribuciones de cada variable en un sistema en sus componentes únicos, redundantes y funcionalmente sinérgicos. La suma de todas estas contribuciones debe satisfacer una ecuación de conservación de la información que luego puede usarse para encontrar la existencia de funciones ocultas, es decir, variables que no se pueden medir o que se consideran sin importancia. (Si la causalidad oculta se vuelve demasiado grande, los investigadores saben que necesitan reconsiderar las variables que incluyen en su análisis).
Para probar el nuevo método, el equipo de Lozano-Durán utilizó SURD para analizar 16 casos de validación: situaciones con soluciones conocidas que normalmente plantearían desafíos importantes a los investigadores que intentan determinar la causalidad.
“Nuestro método le dará consistentemente una respuesta significativa en todos estos casos”, dijo Gonzalo Aranez, investigador postdoctoral en el Laboratorio Aeroespacial de Graduados de Caltech, quien también es autor del artículo. “Otros métodos mezclan causas que no deberían mezclarse y a veces se confunden. Detectan un falso positivo de una causa que no existe, por ejemplo”.
En el artículo, el equipo utilizó SURD para estudiar la turbulencia creada cuando el aire fluye alrededor de una pared. En este caso, el aire fluye más lentamente en altitudes más bajas, más cerca de la pared y más rápido en altitudes más altas. Anteriormente, algunas teorías sobre lo que estaba sucediendo en este escenario sugerían que el flujo a gran altura afectaba lo que estaba sucediendo cerca del muro y no al revés. Otras teorías han sugerido todo lo contrario: que el flujo de aire cerca de la pared afecta lo que sucede en altitudes más altas.
“Analizamos las dos señales con SURD para comprender en qué dirección se produce la interacción”, dice Lozano-Duran. “Resulta que la causalidad proviene de velocidades muy distantes. Además, hay combinaciones en las que las señales interactúan para producir otros tipos de causalidad. Esta descomposición, o causalidad en pedazos, es exclusiva de nuestro enfoque”.