Lo que alimenta la locura de la IA generativa es la creencia de que la industria tecnológica está en camino de lograr una inteligencia sobrehumana y divina. La misión declarada de OpenAI es crear esta inteligencia artificial general, o AGI. Demis Hassabis, el líder de los esfuerzos de IA de Google, tiene el mismo objetivo.
Ahora, el director ejecutivo de Meta, Mark Zuckerberg, está entrando en la carrera. Si bien no tiene un cronograma de cuándo se alcanzará el AGI, ni siquiera una definición exacta para ello, quiere construirlo. Al mismo tiempo, está sacudiendo las cosas al trasladar el grupo de investigación de IA de Meta, FAIR, a la misma parte de la empresa que el equipo que crea productos de IA generativa en las aplicaciones de Meta. El objetivo es que los avances en IA de Meta lleguen más directamente a sus miles de millones de usuarios.
“Hemos llegado a la conclusión de que, para construir los productos que queremos construir, necesitamos construir para la inteligencia general”, dice Zuckerberg en una entrevista con The Verge. “Creo que es importante transmitir eso porque muchos de los mejores investigadores quieren trabajar en los problemas más ambiciosos”.
Aquí, Zuckerberg está diciendo en voz alta que la batalla por el talento de la IA nunca ha sido más feroz, ya que todas las empresas del sector compiten por un grupo extremadamente pequeño de investigadores e ingenieros.
Después del talento, el recurso más escaso en el campo de la IA es la potencia informática necesaria para entrenar y ejecutar grandes modelos. Sobre este tema, Zuckerberg está listo para flexibilizarse. Asegura que, para finales de este año, Meta poseerá más de 340 000 de las GPU H100 de Nvidia, el chip elegido por la industria para construir IA generativa.
Las compras de H100 de Meta para 2023 ascendieron a 150.000, una cifra que solo está empatada con los envíos de Microsoft y es al menos tres veces mayor que la de todos los demás. Cuando se contabilicen sus Nvidia A100 y otros chips de IA, Meta tendrá una reserva de casi 600 000 GPU para fines de 2024, según Zuckerberg.
“Hemos desarrollado la capacidad para hacer esto a una escala que puede ser mayor que la de cualquier otra empresa individual”, dice. “Creo que mucha gente puede no apreciar eso”.
La ejecución
Nadie que trabaje en IA, incluido Zuckerberg, parece tener una definición clara de lo que es la AGI o una idea de cuándo llegará.
“No tengo una definición concisa de una sola frase”, dice. “Se puede discutir si la inteligencia artificial general es similar a la inteligencia de nivel humano, o es como la humana plus, o es una superinteligencia del futuro lejano. Pero para mí, la parte importante es en realidad la amplitud de esta, que es que la inteligencia tiene todas estas capacidades diferentes en las que tienes que ser capaz de razonar y tener intuición”.
Considera que su eventual llegada es un proceso gradual, más que un momento único. “En realidad, no estoy tan seguro de que algún umbral específico se sienta tan profundo”.
Como explica Zuckerberg, el nuevo y más amplio enfoque de Meta en AGI se vio influenciado por el lanzamiento de Llama 2, su último modelo de lenguaje grande, el año pasado. La compañía no creía que la capacidad de generar código tuviera sentido para la forma en que las personas usarían un LLM en las aplicaciones de Meta. Pero sigue siendo una habilidad importante a desarrollar para crear una IA más inteligente, por lo que Meta la creó de todos modos.
“Una hipótesis era que la codificación no es tan importante porque no es como si mucha gente fuera a hacer preguntas de codificación en WhatsApp”, dice. “Resulta que la codificación es realmente importante estructuralmente para que los LLM sean capaces de entender el rigor y la estructura jerárquica del conocimiento y, en general, tengan un sentido más intuitivo de la lógica”.
Meta está entrenando Llama 3 ahora, y tendrá capacidades de generación de código, dice. Al igual que el nuevo modelo Gemini de Google, otro enfoque está en las habilidades de razonamiento y planificación más avanzadas.
“Llama 2 no era un modelo líder en la industria, pero era el mejor modelo de código abierto”, dice. “Con Llama 3 y más allá, nuestra ambición es construir cosas que estén a la vanguardia del arte y, eventualmente, los modelos líderes en la industria”.
Abierto frente a cerrado
La cuestión de quién llega a controlar AGI es muy debatida, como la casi implosión de OpenAI mostró recientemente al mundo.
Zuckerberg ejerce un poder total en Meta gracias a su control de voto sobre las acciones de la empresa. Eso lo coloca en una posición excepcionalmente poderosa que podría amplificarse peligrosamente si alguna vez se logra la AGI. Su respuesta es el libro de jugadas que Meta ha seguido hasta ahora para Llama, que puede, al menos para la mayoría de los casos de uso, considerarse de código abierto.
“Tiendo a pensar que uno de los mayores desafíos aquí será que si construyes algo que es realmente valioso, entonces termina muy concentrado”, dice Zuckerberg. “Mientras que, si lo haces más abierto, entonces eso aborda una gran clase de problemas que podrían surgir del acceso desigual a la oportunidad y el valor. Así que esa es una gran parte de toda la visión del código abierto”.
Sin dar nombres, contrasta el enfoque de Meta con el de OpenAI, que comenzó con la intención de abrir el código de sus modelos, pero se ha vuelto cada vez menos transparente. “Había todas estas empresas que solían ser abiertas, solían publicar todo su trabajo y solían hablar de cómo iban a abrir el código de todo su trabajo. Creo que se ve la dinámica de la gente que se da cuenta: ‘Oye, esto va a ser algo realmente valioso, no lo compartamos'”.
Mientras que Sam Altman y otros defienden los beneficios de seguridad de un enfoque más cerrado para el desarrollo de la inteligencia artificial, Zuckerberg ve una jugada comercial astuta. Mientras tanto, los modelos que se han desplegado hasta ahora aún no han causado daños catastróficos, argumenta.
“Las empresas más grandes que comenzaron con los clientes potenciales más grandes son también, en muchos casos, las que más llaman para decir que es necesario poner en marcha todas estas barreras sobre cómo todos los demás construyen una inteligencia artificial”, me dice. “Estoy seguro de que algunos de ellos están legítimamente preocupados por la seguridad, pero es una gran cosa lo mucho que se alinea con la estrategia”.
Zuckerberg tiene sus propias motivaciones, por supuesto. El resultado final de su visión abierta de la inteligencia artificial sigue siendo una concentración de poder, solo que en una forma diferente. Meta ya tiene más usuarios que casi cualquier empresa en la Tierra y es un negocio de redes sociales tremendamente rentable. Podría decirse que las funciones de IA pueden hacer que sus plataformas sean aún más pegajosas y útiles. Y si Meta puede estandarizar de manera efectiva el desarrollo de la inteligencia artificial lanzando sus modelos abiertamente, su influencia sobre el ecosistema solo crecerá.
Hay otro problema: si alguna vez se logra la AGI en Meta, el llamado a abrirla o no es, en última instancia, de Zuckerberg. No está listo para comprometerse de ninguna manera.
“Mientras tenga sentido y sea lo más seguro y responsable, creo que en general queremos inclinarnos hacia el código abierto”, dice. “Obviamente, no quieres que te obliguen a hacer algo porque dijiste que lo harías”.
No es un pivote a la inteligencia artificial
En el contexto más amplio de Meta, el momento del nuevo impulso de AGI de Zuckerberg es un poco incómodo.
Han pasado solo dos años desde que cambió el nombre de la empresa para centrarse en el metaverso. Las últimas gafas inteligentes de Meta con Ray-Ban están mostrando una tracción temprana, pero las gafas de realidad aumentada completas se sienten cada vez más lejanas. Apple, por su parte, ha validado recientemente su apuesta por los auriculares con el lanzamiento de los Vision Pro, a pesar de que la realidad virtual sigue siendo una industria de nicho.
Zuckerberg, por supuesto, no está de acuerdo con la caracterización de su enfoque en la inteligencia artificial como un pivote.
“No sé cómo afirmar de forma más inequívoca que seguimos centrándonos en Reality Labs y en el metaverso”, me dice, señalando el hecho de que Meta sigue gastando más de 15.000 millones de dólares al año en la iniciativa. Sus gafas inteligentes Ray-Ban agregaron recientemente un asistente visual de inteligencia artificial que puede identificar objetos y traducir idiomas. Considera que la inteligencia artificial generativa desempeñará un papel más importante en los esfuerzos de hardware de Meta en el futuro.
Ve un futuro en el que los mundos virtuales son generados por inteligencia artificial y llenos de personajes de IA que acompañan a personas reales. Dice que este año llegará una nueva plataforma que permitirá a cualquiera crear sus propios personajes de inteligencia artificial y distribuirlos a través de las aplicaciones sociales de Meta. Quizás, sugiere, estas IA incluso puedan publicar su propio contenido en los feeds de Facebook, Instagram y Threads.
Meta sigue siendo una empresa de metaverso. Es la empresa de redes sociales más grande del mundo. Ahora está tratando de construir AGI. Zuckerberg enmarca todo esto en torno a la misión general de “construir el futuro de la conexión”.
Hasta la fecha, esa conexión ha sido principalmente de humanos interactuando entre sí. Hablando con Zuckerberg, está claro que, en el futuro, también se tratará cada vez más de que los humanos hablen con las IA. Es obvio que él ve este futuro como inevitable y emocionante, ya sea que el resto de nosotros estemos listos para él o no.