Los valores y tradiciones culturales difieren en todo el mundo, pero los grandes modelos de lenguaje (LLM), utilizados en programas de generación de texto como ChatGPT, tienden a reflejar los valores de los países europeos protestantes y de habla inglesa. Un equipo de investigación dirigido por la Universidad de Cornell cree que existe una forma sencilla de resolver este problema.
Los investigadores probaron cinco versiones de ChatGPT y descubrieron que lo que llamaron “incitación cultural” (pedir al modelo de IA que actuara como otra persona en el mundo) reducía el sesgo de respuesta en la mayoría de los más de 100 países que probaron. Los hallazgos sugieren que podría haber una manera fácil para que cualquiera pueda controlar los modelos de IA para alinearlos con los valores culturales y reducir el sesgo cultural en estos sistemas ampliamente utilizados.
“No hay muchas organizaciones en el mundo que tengan la capacidad de construir grandes modelos de lenguaje, porque requiere muchos recursos, por lo que es aún más importante para aquellos que tienen esa capacidad y, debido a eso, considerar cuidadosamente cuáles podrían ser sus modelos”. diferentes partes del mundo”, afirmó René Kizilczek, profesor asociado de ciencias de la información.
“En todo el mundo, la gente utiliza herramientas como ChatGPT directa e indirectamente a través de otras aplicaciones para aprender, trabajar y comunicarse”, dijo, “y así como las empresas de tecnología desarrollan teclados locales en computadoras portátiles para adaptarse a diferentes idiomas, LL.M. adaptarse a diferentes normas y valores culturales”.
Kizilcek es el autor principal de “Cultural Bias and Cultural Alignment of Large Language Models”, publicado el 17 de septiembre. Nexo PNAS. El autor principal, Yan Tao, es estudiante de doctorado en ciencias de la información y miembro del Future of Learning Lab de Kizilsek.
Para su investigación, Kizilcec y su equipo probaron cinco versiones de ChatGPT (3, 3.5 Turbo, 4, 4-Turbo y 4o, esta última lanzada en mayo) y compararon las respuestas de los modelos con datos de encuestas representativas a nivel nacional de Integrated Values. . encuesta, una medida establecida de los valores culturales para 107 países y regiones.
Para los últimos modelos probados (GPT-4, 4-Turbo, 4o), este último induce una mejor alineación cultural entre el 71% y el 81% de los países y regiones.
“A diferencia del ajuste de modelos o el uso de indicaciones en diferentes idiomas para provocar valores culturales específicos del idioma, que generalmente requieren recursos especializados, las indicaciones culturales sólo implican mencionar una identidad cultural directamente en la indicación”, dijo Tao. “Este método es más fácil de usar y no requiere grandes recursos”.
Esta investigación fue financiada en parte por la Fundación Jacobs y Digital Future.