OpenAI, apoyada por Microsoft, ha anunciado una nueva actualización que le permite acceder a información actual en internet, superando la fecha límite de septiembre de 2021.
Los usuarios de las versiones de pago de ChatGPT podrán emplear la opción “Navega con Bing” para explorar la web con el bot. OpenAI espera ampliar esta función pronto, después de haberla probado anteriormente con el motor de búsqueda Bing, pero haberla desactivado por problemas de barreras de pago.
No obstante, la nueva integración genera dudas sobre la privacidad, además de los temores de que el bot pueda acceder a contenido nocivo, falso o protegido por derechos de autor en línea, y mostrárselo a los usuarios.
Asimismo, para que el nuevo complemento del navegador funcione, los usuarios deben activar el historial de chat, lo que significa compartir datos personales con el modelo. Esto podría implicar riesgos potenciales de revelar información sensible de las personas.
OpenAI y la ruptura de barreras
Recientemente OpenAI comunicó el despliegue de nuevas funcionalidades para ChatGPT que le permitirán ejecutar indicaciones con imágenes y voz además de texto.
Según trascendió, los usuarios de ChatGPT Plus y Enterprise podrán acceder a estas nuevas características en las próximas dos semanas. La funcionalidad de voz será opcional y estará disponible en iOS y Android, mientras que la funcionalidad de imágenes estará disponible en todas las plataformas ChatGPT.
Los planes contemplan la extensión de la disponibilidad de funcionalidades de imágenes y voz a más usuarios después del lanzamiento inicial.
El chat de voz permite una conversación oral entre el usuario y ChatGPT, para lo cual solo se deberá pulsar el botón y decir la pregunta. El chatbot procesará la información y responderá con voz en lugar de texto.
Es una forma similar a la de los asistentes virtuales como Alexa o Google Assistant y podría ser el inicio de una transformación completa de estos servicios. OpenAI hace este anuncio pocos días después de que Amazon presentara una función parecida para Alexa.
Para lograr la comunicación de voz y audio con ChatGPT, OpenAI usa un nuevo modelo de texto a voz que puede producir “audio parecido al humano a partir de solo texto y unos segundos de muestra de voz”. Además, su modelo Whisper puede “convertir tus palabras habladas en texto”.
OpenAI reconoce los problemas que podrían surgir por el poder de esta función, como “la posibilidad de que actores malintencionados se hagan pasar por personajes públicos o cometan fraudes”.
Esta es una de las principales razones por las que la empresa planea restringir el uso de sus nuevas funciones a “casos de uso y asociaciones específicas”. Incluso cuando las funciones estén más disponibles, serán accesibles principalmente para usuarios más privilegiados, como los desarrolladores.
Con la función de imagen, en cambio, se podrá enviar una foto a ChatGPT junto con alguna pregunta o indicación. El chatbot responderá con la ayuda de la herramienta de dibujo en la aplicación, y se podrá dialogar hasta solucionar el problema indicado por el usuario. Esta función se parece a Copilot de Microsoft en Windows, que usa el modelo de OpenAI.
ChatGPT tiene algunos desafíos, como el problema de alucinación que sigue teniendo. Por eso, OpenAI ha decidido limitar algunas funcionalidades cuando se usa la función de imagen, como la capacidad del chatbot para hacer análisis y afirmaciones directas sobre las personas.
ChatGPT empezó como una herramienta de texto a voz a finales del año pasado, pero OpenAI ha mejorado rápidamente su habilidad. El chatbot original usaba el modelo de lenguaje GPT-3, pero se ha actualizado a GPT-3.5 y ahora a GPT-4, que es el modelo que tiene la nueva característica. OpenAI ha anunciado varias colaboraciones empresariales con GPT-4, como Duolingo, Spotify y Be My Eyes, aplicaciones y servicios que ya usaban el modelo de IA antes de la actualización de imágenes y voz.
Los costos
Microsoft hizo una inversión clave de 1.000 millones de dólares en OpenAI en 2019. Esto fue crucial para desarrollar la tecnología de ChatGPT, que causó una revolución en el mercado tres años después. La nueva tecnología se convirtió en la aplicación que más rápido alcanzó sus primeros 100 millones de usuarios, solo superada después por el exitoso lanzamiento de Threads.
A principios de este año, Microsoft fortaleció la alianza, para ser el proveedor exclusivo de los servicios en la nube de OpenAI, que son la base de todos sus productos y servicios. Se calcula que este nuevo acuerdo implicó una nueva inversión de Microsoft de 10 mil millones de dólares.
Pero el éxito tiene un precio. Crear ChatGPT fue tan caro que OpenAI tuvo pérdidas de unos 540 millones de dólares en 2022. Y eso fue solo el principio. Mantenerlo funcionando podría costar al menos 700 mil dólares por día. La mayor parte del dinero se destina al mantenimiento de sus servidores, según estimó en abril la firma SemiAnalysis.
Microsoft ha buscado soluciones desde todos los ángulos posibles. Desde el desarrollo de chips propios, en un proyecto conjunto con AMD. Hasta la posibilidad de usar energía nuclear para sus centros de datos donde se alojan Microsoft Cloud y la inteligencia artificial.
Información generada con IA/ Fuentes: Hipertextual y Digital Trends