💻 OpenAI presenta dos potentes modelos abiertos

openai-logo

OpenAI ha cumplido su promesa de retomar el camino de la inteligencia artificial abierta. La compañía presentó gpt-oss, sus primeros modelos de lenguaje open weight desde GPT-2 en 2019. Las dos versiones disponibles, gpt-oss-20b y gpt-oss-120b, cuentan con 20.000 millones y 120.000 millones de parámetros, respectivamente.

Sam Altman, director ejecutivo de OpenAI, asegura que estos modelos superan en rendimiento a otros de tamaño similar. Además, están optimizados para hardware comercial, lo que facilita su despliegue sin necesidad de infraestructuras costosas. La versión de 20.000 millones de parámetros solo requiere 16 GB de RAM, lo que la hace accesible para ordenadores modernos. Su desempeño se compara con el de o3-mini en pruebas básicas.

La versión más potente, con 120.000 millones de parámetros, puede ejecutarse en una sola GPU con 80 GB de RAM, como la NVIDIA H100 SXM. OpenAI afirma que su rendimiento es cercano al de o4-mini. Ambos modelos ya están disponibles en Hugging Face bajo la licencia Apache 2.0.

OpenAI diseñó gpt-oss pensando en desarrolladores que necesitan soluciones versátiles. El modelo más pequeño es ideal para tareas que requieren baja latencia, mientras que el más grande está orientado a aplicaciones de propósito general y razonamiento avanzado. Los usuarios pueden elegir entre tres niveles de procesamiento: bajo para respuestas rápidas, medio para equilibrio entre velocidad y detalle, y alto para análisis profundos.

Estos modelos también destacan en su integración con agentes de IA, permitiendo navegación web, ejecución de código Python y compatibilidad con la API Responses de OpenAI. La compañía lanzó implementaciones para inferencias con PyTorch y la plataforma Metal de Apple. Aunque los usuarios pueden ajustar los modelos para casos específicos, OpenAI implementó medidas de seguridad para prevenir usos maliciosos.

La empresa evaluó riesgos potenciales, como el ajuste con datos especializados en biología y ciberseguridad, simulando escenarios de ataque. Expertos independientes revisaron la metodología y recomendaron mejoras en el entrenamiento y las evaluaciones. OpenAI asegura que estos procesos marcan un avance en la seguridad de los modelos abiertos.

Cabe destacar que gpt-oss no es de código abierto, sino open weight. Esto significa que, aunque se libera el código, los datos de entrenamiento no están disponibles. OpenAI resalta que estos modelos reducen barreras para mercados emergentes y organizaciones con recursos limitados, ofreciendo capacidades avanzadas sin depender de soluciones propietarias.

Autor

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *