Este lunes marcó un hito en el mundo de la inteligencia artificial con la presentación de GPT-4o por parte de OpenAI. Este nuevo modelo de lenguaje, considerado el más potente hasta la fecha, promete cambiar la forma en que interactuamos con ChatGPT al incorporar capacidades avanzadas de procesamiento de audio e imágenes.
Durante la presentación, Mira Murati, jefa tecnológica de OpenAI, destacó que GPT-4o estará disponible para todos los usuarios de ChatGPT, tanto en su versión gratuita como en las variantes de pago. Una de las principales mejoras de esta nueva versión es su capacidad nativa para procesar audio e imágenes, lo que ha permitido realizar demostraciones en vivo, incluyendo algunas con sugerencias proporcionadas por seguidores de la plataforma X (Twitter).
check it out: pic.twitter.com/eDvHseLngy
— Sam Altman (@sama) May 13, 2024
Una de las características más destacadas es su capacidad para interactuar de manera más conversacional con los usuarios a través de la voz. Ahora, los usuarios pueden interrumpir al modelo de lenguaje en medio de una respuesta para solicitar cambios en el prompt original, sin demoras ni problemas de latencia.
Además, los ingenieros de OpenAI demostraron la capacidad para interpretar en tiempo real lo capturado por la cámara de un smartphone, desde resolver ecuaciones lineales hasta detectar emociones faciales.
¿Cuándo llegará GPT-4o?
El despliegue se realizará de manera iterativa, comenzando con las capacidades de texto e imágenes disponibles desde hoy para todos los usuarios de ChatGPT. El Modo Voz de GPT-4o llegará en versión alfa a los suscriptores de ChatGPT Plus en las próximas semanas, y estará disponible a través de la API de OpenAI.
La “o” en GPT-4o significa “omni”, reflejando su capacidad de interactuar en texto, audio y vídeo. Sin embargo, OpenAI reconoce que estas nuevas capacidades también pueden presentar nuevos riesgos, por lo que la liberación al público general se realizará de manera gradual y controlada.
OpenAI está dando un paso significativo hacia el futuro de la interacción humano-IA, explorando nuevas posibilidades y abordando desafíos emergentes en el campo de la inteligencia artificial.
Generado por IA