OpenAI acaba de anunciar la tercera versión de su inteligencia artificial para generar imágenes a partir de texto, DALL-E 3, que llega con varias mejoras y nuevas características. Lo más interesante es que la tecnología ahora se integra de forma nativa en ChatGPT, permitiendo a los usuarios crear mejores prompts directamente desde el chatbot.
De acuerdo con la startup de Sam Altman, DALL-E 3 evoluciona considerablemente en comparación con su predecesor a la hora de interpretar las solicitudes de los usuarios. Pero aquí es donde, además, sobresale el contacto más cercano con ChatGPT.
Al producir una imagen, será posible pedirle al chatbot que la genere directamente, o que cree el prompt en cuestión. ChatGPT brindará una indicación más extensa y detallada que permitirá que DALL-E 3 la interprete mejor y ofrezca resultados más precisos.
also, the video we made for dalle 3 is SO CUTE: pic.twitter.com/k1FOFTOsU5
— Sam Altman (@sama) September 20, 2023
“Los sistemas modernos de conversión de texto a imagen tienden a ignorar palabras o descripciones, lo que obliga a los usuarios a aprender ingeniería de prompts. DALL·E 3 representa una evolución en nuestra capacidad de generar imágenes que se adhieran exactamente al texto que proporcionas”, afirma OpenAI.
OpenAI ha dejado en claro que el salto cualitativo en las imágenes generadas con DALL-E 3 es considerable. La nueva tecnología, afirma la compañía, comprende mejor cómo debe componer una escena y cuál es la vinculación entre los elementos que forman parte de la misma.
DALL-E 3 promete mejores resultados gracias a su integración con ChatGPT
DALL-E 3 promete mejores resultados al incluir texto dentro de los dibujos, como también al lidiar con partes del cuerpo humano que antes fallaba en interpretar correctamente. Por ejemplo, las manos. Este era uno de los puntos más flacos de la IA al comparar sus creaciones con las de otras plataformas, como Midjourney.
No obstante, los desarrolladores no han enfocado DALL-E 3 solo en mejorar la calidad de las creaciones o en ofrecer una mejor interpretación de los prompts. También han implementado medidas de seguridad más robustas con el fin de mitigar los sesgos e impedir el uso de la herramienta para crear contenidos potencialmente dañinos como deepfakes.
Es por ello que DALL-E 3 se negará a crear imágenes de figuras públicas a partir de su nombre. Y debido a la creciente preocupación por la divulgación de contenidos falsificados, tampoco ofrecerá resultados basados en el estilo de artistas vivos. Es más, los creadores podrán solicitar que sus trabajos no se utilicen para entrenar al modelo de inteligencia artificial que potencia a esta herramienta. Aunque los cambios se verían aplicados en versiones futuras de la plataforma.
Por otra parte, los de Sam Altman informaron que están investigando cómo ayudar a las personas a detectar imágenes creadas con inteligencia artificial. La empresa ya está probando una herramienta interna, pero no se ha mencionado si planea lanzarla públicamente.
Si quieres probar DALL-E 3, tendrás que ser paciente. La nueva versión de la IA generativa llegará en octubre a los suscriptores de ChatGPT Plus y Enterprise a través de su API. Los laboratorios de investigación, en tanto, tendrán acceso a partir del otoño. Por lo pronto, desde OpenAI no han anunciado cuándo podría estar disponible para el público general.
Información de Hipertextual