En un impulso estratégico para fortalecer su pie en el espacio de IA, Meta lanzó los primeros modelos de su último código abierto AI Suite Lama 4 el sábado.

En un video de Instagram, el CEO de Meta Mark Zuckerberg Company compartió las audaces aspiraciones de IA de la compañía: “Nuestro objetivo es crear la IA más importante del mundo, hacerlo universalmente accesible … He dicho por un tiempo que el código abierto liderará el camino de la IA, y lo hemos comenzado con Lama 4.”

Dos modelos primarios: Lama 4 Scouts y Lama 4 Mavarick-Now disponibles para descargar a través del sitio web de Lama y Hug Face. Estos modelos también sirven como base de Meta AI, el asistente virtual de la compañía ahora está integrado en WhatsApp, Instagram, Messenger y Web.

Además, el Meta Lama presenta 4 gigantesco, describiéndolo como uno de los modelos de lenguaje inteligente (LLMS) y desarrollaron la versión más poderosa. Esto está destinado a ayudar a capacitar y guiar los modelos futuros.

Este despliegue identifica el primer uso de la primera mezcla de la estructura meta (MOE). MOE divide el modelo en elementos especializados: el enfoque se centra en campos como física, poesía, biología o programación. Durante cualquier trabajo en particular, solo se activan los módulos especializados más relevantes, la eficiencia se mejora y se reduce el gasto por capacitación y suposición.

Destaca el modelo

El Lama 4 Scout proporciona la ventana de contexto de 10 millones de token 17 mil millones de parámetros y 16 expertos. Diseñado para manejar una sola GPU, refleja una tendencia hacia los modelos más livianos de peso, de alto rendimiento, combinados con el reciente lanzamiento de Jemma 3 de Google.

Lama 4 Mavarick, también en 17 mil millones de parámetros, pero con 128 expertos, como modelo de objetivo general para una amplia gama de asistencia en el uso de estilo asistente. Meta es capaz de realizar trabajos de chat, lógica y otras obras digitales al describirlo como un “harors “confiable.

Encontrarse La afirmación de que el GPT -4O del abridor Maverick y Google Jemi 2.0 muestra la generación de código, la lógica, el compromiso multilingüe, el análisis de imágenes y el contexto largo en todo el criterio. También compite con DePSEC V 3.1, un modelo grande en el rendimiento en tareas de codificación y lógica.

A principios de este año, DePSEC afirmó que sus modelos coinciden con las principales compañías estadounidenses, fomentando las preocupaciones sobre el aumento de la competencia global en la IA. Sin embargo, los ejecutivos de Meta y Google han reducido su impacto.

¿Qué es lo que hay a continuación? Behmath y más allá

Todavía en desarrollo, se espera que el modelo Behemoth Lama 4 aparezca en 288 mil millones de parámetros activos, 16 expertos y aproximadamente 2 billones de parámetros totales. Meta dice que excedió GPT -4.5, Claud Sonnet 3.7 y Gemi 2.0 Pro en pruebas relacionadas con STEM.

El Zuckerberg Lama 4 también vinculó el argumento, se centró en un modelo de resolución de problemas especialmente complejo y funciones analíticas. Se pueden esperar más detalles en las próximas semanas.

Meta escribió en una publicación de blog: “Esto es solo el comienzo de la línea Lama 4”. “Creemos que los sistemas de IA más avanzados deben tomarse en pasos generalizados, participar en conversaciones naturales y poder lidiar con problemas que nunca antes se habían enfrentado”.

Ampliar

Meta ha revelado que las descargas de modelos LAMA han excedido mil millones solo dos semanas antes de la introducción de 650 millones a Lama 4 en diciembre de 2024.

Al regresar en enero, Zuckerberg anunció que el costo de infraestructura de IA de la compañía para 2025 sería de entre $ 60 mil millones y $ 65 mil millones, lo que cubre la inversión en servidores, centros de datos y otros recursos necesarios para respaldar el esfuerzo de IA Meta Expander.


Source link