La empresa matriz de Facebook, Meta Platforms Inc., presentó un nuevo y poderoso modelo de inteligencia artificial (IA) que el director ejecutivo, Mark Zuckerberg, calificó de “vanguardia” y dijo que rivalizará con ofertas similares de competidores como OpenAI y Google, de Alphabet Inc.
El nuevo modelo, lanzado el martes, llamado Llama 3.1, tardó varios meses en entrenarse y cientos de millones de dólares en potencia de cómputo. La compañía dijo que representa una actualización importante de Llama 3, que salió en abril.
“Creo que el producto más importante para un asistente de IA va a ser lo inteligente que sea”, dijo Zuckerberg durante una entrevista con Bloomberg . “Los modelos de Llama que estamos construyendo son algunos de los más avanzados del mundo”. Meta ya está trabajando en Llama 4, agregó Zuckerberg.
Los ejecutivos de Meta dicen que el modelo, que se utiliza principalmente para impulsar chatbots tanto dentro de Meta como por desarrolladores externos, tiene una amplia gama de nuevas capacidades, incluido un razonamiento mejorado para ayudar a resolver problemas matemáticos complejos o sintetizar instantáneamente un libro completo de texto. También cuenta con funciones de IA generativa que pueden crear imágenes bajo demanda a través de indicaciones de texto. Una función llamada “Imagínate a ti mismo” permite a los usuarios subir una imagen de su rostro, que luego se puede usar para crear representaciones de ellos en diferentes escenas y escenarios.
Meta utiliza sus modelos Llama para impulsar su chatbot de IA, llamado Meta AI, que opera dentro de sus aplicaciones, incluidas Instagram y WhatsApp, y también como un producto web separado. Zuckerberg dijo que Meta tiene “cientos de millones” de usuarios para su chatbot, y espera que sea el chatbot más utilizado en el mundo para fin de año. Espera que otros fuera de Meta usen Llama para entrenar sus propios modelos de IA.
“Va a ser este maestro el que permita a tantas organizaciones diferentes crear sus propios modelos en lugar de tener que depender de los que están vendiendo los demás”, dijo.
Las inversiones de Meta en IA han sido cuantiosas. Zuckerberg dijo que los modelos Llama 3 de Meta cuestan “cientos de millones de dólares” en potencia de cómputo para entrenar, pero que espera que los modelos futuros cuesten aún más. “En el futuro van a ser miles de millones y muchos miles de millones de dólares de potencia de cómputo”, dijo. En 2023, Meta intentó controlar parte de su gasto en tecnologías futuristas y capas de gestión, recortando miles de puestos de trabajo en lo que Zuckerberg denominó el “año de la eficiencia”. Pero Zuckerberg todavía está dispuesto a gastar en la carrera armamentista de la IA.
“Creo que hay una posibilidad significativa de que muchas de las empresas estén construyendo en exceso ahora, y que mires hacia atrás y digas: ‘Oh, tal vez todos gastamos una cantidad de miles de millones de dólares más de lo que debíamos gastar'”, dijo Zuckerberg. “Por otro lado, creo que todas las empresas que están invirtiendo están tomando una decisión racional, porque la desventaja de estar atrasado es que estás fuera de posición para la tecnología más importante durante los próximos 10 a 15 años”.
Después de toda la inversión, Meta pone a disposición del público la tecnología detrás de Llama para que la use de forma gratuita, siempre que se adhieran a la “política de uso aceptable” de la empresa. Zuckerberg espera que la estrategia de acceso abierto ayude a que el trabajo de la compañía sea la base de otras startups y productos exitosos, lo que le dará a Meta una mayor influencia en la forma en que avanza la industria.
“Si la IA va a ser tan importante en el futuro como lo son las plataformas móviles, entonces simplemente no quiero estar en la posición en la que estamos accediendo a la IA a través” de un competidor, dijo Zuckerberg, quien durante mucho tiempo ha estado frustrado con la dependencia de Meta en la distribución de sus aplicaciones de redes sociales en teléfonos y sistemas operativos de Google y Apple Inc. “Somos una empresa de tecnología y necesitamos ser capaces de construir cosas no solo en la capa de la aplicación, sino todo el camino hacia abajo. Y vale la pena para nosotros hacer estas inversiones masivas para hacer eso”.
A pesar de la promesa de hacer que Llama sea abierto, Zuckerberg y otros altos ejecutivos de la compañía mantienen en secreto los conjuntos de datos utilizados para entrenar Llama 3.1. “A pesar de que está abierto, estamos diseñando esto también para nosotros mismos”, explicó. Meta está utilizando publicaciones de usuarios disponibles públicamente de Facebook e Instagram, así como otros conjuntos de datos “propietarios” que la compañía ha licenciado de otros, dijo Zuckerberg, sin compartir detalles.
También rechazó la idea de que entrenar a Llama con datos de publicaciones de Facebook e Instagram sea una ventaja clave. “Muchos de los datos públicos de esos servicios permitimos que se indexen en los motores de búsqueda, por lo que creo que Google y otros también tienen la capacidad de usar muchos de esos datos”, dijo.
Meta dijo a los inversores en abril que planeaba gastar miles de millones de dólares más de lo esperado inicialmente este año, siendo las inversiones en IA una de las principales razones. Se espera que la compañía tenga unas 350,000 GPU Nvidia Corp. H100 para fin de año, según una publicación de blog de la compañía. Los chips H100 se han convertido en la tecnología fundamental utilizada para entrenar grandes modelos de lenguaje como Llama y ChatGPT de OpenAI, y pueden costar más de decenas de miles de dólares cada uno.