Estocolmo/San Francisco:
En los primeros años, conseguir que modelos de IA como ChatGPT o su rival Cohere produjeran respuestas similares a las humanas requirió grandes equipos de trabajadores de bajo costo que ayudaran a los modelos a distinguir información básica como la imagen de un automóvil o una zanahoria.
Pero las actualizaciones más sofisticadas de los modelos de IA en un ámbito ferozmente competitivo ahora exigen una red en rápida expansión de entrenadores humanos con conocimientos especializados, desde historiadores hasta científicos, algunos con doctorados.
“Hace un año, podríamos habernos salido con la nuestra contratando estudiantes universitarios para enseñarles cómo mejorar la IA en general”, dice el cofundador de Koher, Evan Zhang, hablando de sus formadores humanos internos.
“Ahora modelamos a médicos autorizados que enseñan cómo comportarse en un entorno médico, o a analistas financieros o contadores”.
Para seguir capacitándose, Cohere, que finalmente fue valorada en 5 mil millones de dólares, trabajó con una startup llamada Invisible Tech. Cohere es uno de los principales competidores de OpenAI y se especializa en IA para empresas.
Startup Invisible Tech emplea a miles de formadores, trabaja de forma remota y se ha convertido en un socio clave para que las empresas de IA, desde AI21 hasta Microsoft, entrenen sus modelos de IA para reducir los errores, conocidos en el mundo de la IA como alucinaciones.
“Tenemos 5.000 personas en más de 100 países alrededor del mundo que son especialistas en doctorado, maestría y trabajo del conocimiento”, dijo el fundador de Invisible, Francis Pedraza.
Invisible paga hasta 40 dólares la hora, dependiendo de la ubicación del trabajador y de la complejidad del trabajo. Algunas empresas como Outlier pagan hasta 50 dólares la hora, mientras que otra empresa llamada Labelbox dice que paga hasta 200 dólares la hora por temas de “alta habilidad” como la física cuántica, pero comienza en 15 dólares por temas básicos.
Invisible se fundó en 2015 como una empresa de automatización del flujo de trabajo que ofrece a la empresa de entrega de alimentos DoorDash la posibilidad de digitalizar sus menús de entrega. Pero las cosas cambiaron cuando una empresa de investigación relativamente desconocida llamada OpenAI se acercó a ellos antes del lanzamiento público de ChatGPT en la primavera de 2022.
“OpenAI nos trajo un problema, que era que cuando hacías una pregunta en una versión anterior de ChatGPT, era alucinante. No podías creer la respuesta”, dijo Pedraza a Reuters.
“Necesitan un socio de entrenamiento avanzado de IA para reforzar el aprendizaje con retroalimentación humana”.
OpenAI no respondió a las solicitudes de comentarios.
La IA generativa crea contenido nuevo basado en datos anteriores utilizados para entrenarlo. Sin embargo, a veces no puede distinguir entre información verdadera y falsa y produce resultados falsos conocidos como alucinaciones. En un ejemplo notable, un chatbot de Google en 2023 compartió información incorrecta en un video promocional sobre qué satélite fue el primero en fotografiar un planeta fuera del sistema solar de la Tierra.
Las empresas de IA son conscientes de que las alucinaciones pueden descarrilar el atractivo de GenAI para las empresas y están intentando varias formas de reducirlo, incluido el uso de entrenadores humanos para enseñar conceptos de realidad y ficción.
Desde que se incorporó a OpenAI, Invisible dice que se ha convertido en un socio de capacitación en IA para la mayoría de las empresas GenAI, incluidas Cohere, AI21 y Microsoft. Cohere y AI21 han confirmado que son clientes. Microsoft no ha confirmado que sea cliente de Invisible.
“Todas estas son organizaciones que tuvieron desafíos de capacitación, donde su costo número uno fue la potencia informática, y luego el costo número dos fue la capacitación de calidad”, dijo Pedraza.
¿Cómo funciona?
OpenAI, que inició el frenesí en torno a GenAI, tiene un equipo de investigadores llamado “Equipo de datos humanos” que trabaja con entrenadores de IA para recopilar datos especializados para entrenar modelos como ChatGPT.
Los investigadores de OpenAI han ideado varias pruebas, como reducir las alucinaciones o mejorar el estilo de escritura, y han trabajado con entrenadores de IA de Invisible y otros proveedores, dijo una fuente familiarizada con los procesos de la compañía.
En un momento dado, se están ejecutando docenas de pruebas, algunas con herramientas desarrolladas por OpenAI y otras con herramientas de proveedores, dijo la persona.
En función de lo que quieren las empresas de IA (desde mejorar en la historia sueca o hacer modelos financieros), Invisible contrata personal con títulos relevantes para esos proyectos, lo que reduce la carga de gestionar cientos de formadores por parte de las empresas de IA.
“OpenAI tiene algunos de los científicos informáticos más increíbles del mundo, pero no son expertos en historia sueca ni en cuestiones de química o biología ni en nada que se pueda preguntar”, dijo Pedraza, añadiendo que más de 1.000 trabajadores contratados llenan OpenAI. solo
Zhang de Koher dijo que utilizó personalmente a los entrenadores de Invisible para encontrar formas de enseñarle a su modelo GenAI a encontrar información relevante a partir de un gran conjunto de datos.
competencia
Los competidores en este espacio incluyen Scale AI, una nueva empresa privada valorada en 14 mil millones de dólares que proporciona conjuntos de datos de capacitación a empresas de IA. También se ha aventurado a proporcionar formadores de IA y cuenta con OpenAI como cliente. Scale AI no respondió a una solicitud de entrevista para esta historia.
Invisible, que será rentable a partir de 2021, ha recaudado sólo 8 millones de dólares de capital inicial.
“Somos propiedad del equipo en un 70% y sólo un 30% de los inversores”, dijo Pedraza. “Facilitamos rondas secundarias y la operación más reciente tuvo una valoración de 500 millones de dólares”. Reuters no pudo confirmar esa evaluación.
Los formadores humanos se unen primero a la formación en IA a través de un trabajo de etiquetado de datos que requiere poca cualificación y paga poco, a veces tan solo 2 dólares, realizado principalmente por personas de países africanos y asiáticos.
A medida que las empresas de IA lanzan modelos más avanzados, crece la demanda de formadores especializados y en docenas de idiomas, creando un nicho bien remunerado donde trabajadores de una variedad de disciplinas pueden convertirse en formadores de IA sin saber codificar.
La demanda de empresas de IA está llevando a la creación de más empresas que ofrecen servicios similares.
“Mi bandeja de entrada está básicamente inundada de nuevas empresas que aparecen aquí y allá. Veo esto como un nuevo espacio donde las empresas contratan personas para generar datos para laboratorios de inteligencia artificial como el nuestro”, dijo Zhang.
(A excepción del titular, esta historia no fue editada por el personal de NDTV y apareció en un canal sindicado).