🐳 DeepSeek presenta actualización de su modelo principal V3

DeepSeek
Foto: Getty Images

La empresa china de inteligencia artificial DeepSeek presentó una actualización de su modelo principal V3. La compañía afirma que esta nueva versión incluye una característica que la optimiza para chips de fabricación nacional. El modelo también ofrece velocidades de procesamiento superiores.

Este enfoque en la compatibilidad con chips domésticos puede indicar que DeepSeek posiciona sus modelos de inteligencia artificial para funcionar con el ecosistema semiconductor emergente de China. Esta estrategia coincide con el impulso de Beijing para reemplazar la tecnología estadounidense, una respuesta a las restricciones a la exportación impuestas por Washington.

DeepSeek convulsionó el mundo tecnológico este año con el lanzamiento de sus modelos de inteligencia artificial. Estos modelos compiten con occidentales como ChatGPT de OpenAI, pero con costos operativos inferiores.

La actualización al modelo DeepSeek-V3.1 sigue a otras dos mejoras recientes de sus sistemas centrales. La compañía lanzó una actualización R1 en mayo y una mejora anterior de V3 en marzo.

DeepSeek detalló en una publicación de WeChat que su modelo DeepSeek-V3.1 emplea el formato de precisión UE8M0 FP8. Este formato está optimizado para las próximas chips de próxima generación de fabricación nacional. La empresa no identificó qué modelos de chips específicos o fabricantes serán compatibles.

FP8, o punto flotante de 8 bits, es un formato de procesamiento de datos que permite a los modelos de inteligencia artificial operar con mayor eficiencia. Utiliza menos memoria y funciona más rápido que los métodos tradicionales.

La compañía también explicó que DeepSeek-V3.1 cuenta con una estructura de inferencia híbrida. Esta capacidad permite que el modelo opere en modos de razonamiento y de no razonamiento.

Los usuarios pueden alternar entre estos modos con un botón de «pensamiento profundo» en la aplicación oficial y la plataforma web de la empresa. Ambas plataformas ejecutan ya la versión V3.1.

DeepSeek también ajustará los costos por el uso de la API de su modelo a partir del 6 de septiembre. Esta API es una plataforma que permite a desarrolladores de otras aplicaciones y productos web integrar sus modelos de inteligencia artificial.

Autor

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *