Después de mucha especulación y de un supuesto retraso en su anuncio, Google finalmente ha lanzado Gemini, su modelo de inteligencia artificial más potente hasta la fecha. Desde hoy, de hecho, la tecnología ya comienza a estar disponible en algunos de los productos de la firma californiana, como Bard, su rival de ChatGPT, y en el Pixel 8 Pro.
Google ha presentado tres versiones de Gemini. Por un lado, se encuentra Gemini Nano, su variante enfocada en la eficiencia para el procesamiento y la ejecución de tareas directamente desde un dispositivo. Esta será la IA que llegará a la versión tope de gama del Pixel 8 para potenciar nuevas funciones.
Por otra parte, nos encontramos con Gemini Pro, una alternativa intermedia que Google afirma que es la mejor para escalar en un rango muy amplio de tareas. Una versión refinada de este modelo de inteligencia artificial es la que ahora se implementa en Bard. De acuerdo con los californianos, es la actualización más grande que ha recibido su chatbot. Eso sí, si bien estará disponible en 170 países, en principio la nueva IA solo se podrá usar en inglés.
Gemini Ultra es, en tanto, la versión más potente y capaz que Google ha desarrollado para llevar a cabo tareas complejas. Esta variante se presenta para competir cara a cara con GPT-4, de OpenAI, y, según parece, lo vence en la mayoría de las pruebas de rendimiento que han revelado los de Mountain View.
“Con una puntuación del 90,0 %, Gemini Ultra es el primer modelo que supera a los expertos humanos en MMLU (comprensión masiva de lenguajes multitarea), que utiliza una combinación de 57 materias como matemáticas, física, historia, derecho, medicina y ética para evaluar tanto conocimientos generales como las habilidades para resolver problemas”, explican los californianos.
Al presentar Gemini, Google ha remarcado sus capacidades de razonamiento sofisticado, lo cual le permite analizar, comprender y extraer información de forma sencilla. Sin importar qué tan grande sea el volumen de documentos que deba estudiar. Además, al tratarse de un modelo de inteligencia artificial multimodal, no solo puede comprender distintos métodos de entrada —texto, audio, vídeos, fotos—, sino que puede procesarlos en simultáneo.
Así mismo, llega con habilidades mejoradas para su uso en entornos de programación. Esto es algo que se ha vuelto bastante común en los modelos de inteligencia artificial aplicados a chatbots como ChatGPT, Copilot, Code Llama o el propio Bard. No obstante, Google sostiene que Gemini lleva esta característica a otro nivel.
“Nuestra primera versión de Gemini puede comprender, explicar y generar código de alta calidad en los lenguajes de programación más populares del mundo, como Python, Java, C++ y Go. Su capacidad para trabajar en varios lenguajes y razonar sobre información compleja lo convierte en uno de los modelos básicos de codificación líderes en el mundo”, dicen los de Mountain View.
Google también afirma que Gemini se ha desarrollado con el objetivo de hacerlo escalable y enfocado en la seguridad. Es por ello que el nuevo modelo de inteligencia artificial incluye potentes filtros para limitar el uso inapropiado de la tecnología. Los californianos también han trabajado con expertos para detectar “puntos ciegos” que puedan ser explotados con fines nefarios.
Gemini en el Pixel 8 Pro
Como indicamos al comienzo, Google ha decidido integrar Gemini en Bard, su alternativa a ChatGPT, y en el Pixel 8 Pro. En el caso del smartphone, las primeras características que sacarán provecho de esta inteligencia artificial llegarán con una actualización disponible desde hoy.
En principio, serán dos funciones impulsadas por Gemini Nano: respuestas rápidas en Gboard para WhatsApp y la opción de generar un resumen de los audios registrados con la grabadora de sonidos. Se sumarán más funcionalidades con el paso del tiempo.
Google aspira a integrar Gemini en más productos en el corto plazo. De hecho, la corporación pretende introducirlo pronto en su buscador y en Chrome, Duet AI y Google Ads. Si bien no se ha especificado, sería a través de Gemini Pro, que ya se usa en Bard.