Los métodos tradicionales de planificación urbana requieren importantes habilidades técnicas y trabajo manual.
Los investigadores de Virginia Tech están trabajando para cambiar eso.
Una nueva investigación muestra el potencial de los grandes modelos de lenguaje (LLM), como ChatGPT y Gemini de Google, para evaluar entornos creados por humanos utilizando imágenes de escenas callejeras.
Al comparar el desempeño del LLM con los métodos tradicionales de aprendizaje profundo de planificación urbana, una investigación de la Facultad de Recursos Naturales y Medio Ambiente encontró que el desempeño basado en el LLM era similar a los métodos establecidos. A diferencia de los métodos tradicionales que requieren experiencia técnica o trabajo manual, los investigadores descubrieron que los LLM ofrecen herramientas más accesibles para los usuarios, lo que facilita que las partes interesadas en políticas y planificación utilicen estos modelos en ciudades pequeñas y medianas para gestionar la infraestructura urbana inteligente.
“Mi objetivo es miniaturizar las tecnologías, hacerlas más asequibles y efectivas para las ciudades pequeñas”, dijo Jungwon Kim, profesor asistente de geografía y director de Smart Cities for Good. “Las ciudades inteligentes utilizan análisis urbanos avanzados en tecnología, como la inteligencia artificial y la ciencia de datos, para procesar datos de alta calidad que capturan los entornos urbanos y cómo las personas los perciben. Estas tecnologías nos ayudan a comprender mejor cuestiones urbanas como el transporte y la salud”.
Con esta nueva investigación, se ha demostrado que las herramientas de IA generativa pueden analizar imágenes e identificar automáticamente elementos como bancos, aceras o farolas.
Anteriormente, los investigadores tenían que analizar imágenes manualmente, lo que requería mucha mano de obra.
Un ejemplo específico es la evaluación del entorno construido, como qué tan transitable a pie o en bicicleta es un área en particular. Kim tenía IA para identificar características ambientales incorporadas (bancos, aceras, árboles y farolas), todos elementos que influyen en cómo las personas perciben el movimiento y la seguridad.
“Esto democratiza el acceso a herramientas avanzadas que antes sólo podían ser utilizadas por expertos con habilidades de codificación y recursos informáticos de alto rendimiento”, afirmó Kim. “Sin embargo, también existen limitaciones, como sesgos en los datos de entrenamiento de IA, que pueden conducir a disparidades geográficas. Por ejemplo, estas herramientas funcionan mejor en ciudades grandes que en ciudades pequeñas debido a la disponibilidad desigual de datos para entrenar modelos de IA”.
La investigación se publicó en The Professional Geographer a principios de octubre de 2024 y se realizó en colaboración con Ki Moon Jang en el Instituto de Tecnología de Massachusetts.
Aunque la herramienta es muy poderosa, puede producir alucinaciones y hacer suposiciones basadas en lagunas en sus datos de entrenamiento.
“Por eso es importante utilizar estas herramientas con cuidado, especialmente en entornos profesionales donde la precisión es importante”, afirmó Kim. “Todavía estoy entusiasmado con el potencial de estas herramientas, no solo para mi investigación, sino también para estudiantes y profesionales que ahora tienen fácil acceso a análisis avanzados. Sin embargo, debemos ser conscientes de las limitaciones y sesgos que conlleva el uso. IA urbana.