OpenAI ofrece nuevo modelo de lenguaje y renueva la oferta de ChatGPT

Los nuevos modelos GPT‑4.1 -en versiones estándar, mini y nano- se encuentran disponibles vía API y en la suscripción Pro, de 200 € mensuales, mejorando sus capacidades de codificación y comprensión del contexto.
21 de abril, 2025
Un usuario de ChatGPT

Sigue la ‘guerra’ por el dominio en el ámbito de la inteligencia artificial, protagonizada entre otros por Google con sus soluciones Gemini, la francesa Antrophic con su familia Claude, y la china DeepSeek. Y, cómo no, con OpenAI, hasta ahora absoluta dominadora pero que no debe dormirse sobre los laureles, y no parece dispuesta a hacerlo.

Su último movimiento ha consistido en la reciente presentación de una nueva familia de modelos, la GPT‑4.1, que llega en tres versiones: la mencionada GPT-4.1, que vendría a ser el modelo «completo», más potente, pero también más costoso en término de ejecución (tanto a nivel de recursos como económico), y las versiones mini y nano, más adaptadas a tareas específicas, y con menor coste en todos los sentidos cuanto más pequeña es su denominación.

Desde la firma estadounidense indican que las tres versiones superan a GPT‑4o y GPT‑4o mini en todas las métricas, incorporando, además, una ventana de contexto de hasta 1 millón de tokens frente a los 128.000 que ofrecía la generación anterior. En paralelo, se actualiza la base de conocimiento hasta junio de 2024 y se optimiza la relación entre potencia, coste y tiempo de respuesta.

Tanto en la comprensión de instrucciones largas, como en la comprensión de contextos en tareas multimodales (que implican tanto imágenes cómo vídeo), los resultados de estos nuevos modelos en distintas pruebas, superan en varios puntos a los conseguidos por el modelo que dejan atrás, GPT-4o.

Probablemente espoleada por la necesidad de recortar costes operativos, pero también por la presión ejercida por el modelo ultraoptimizado de DeepSeek, OpenAI ha hecho que la familia de modelos GPT-4.1 reduzca sus costes operativos y desplace la curva de relación rendimiento‑latencia, ofreciendo mayor capacidad de razonamiento al mismo tiempo que abarata el uso en producción.

Rendimiento en desarrollo de software

El sector del desarrollo de software emerge como uno de los principales beneficiados con estos nuevos modelos, ya que mejoran su puntuación en gran medida en la generación de código, resolviendo una mayor cantidad de retos propuestos en las pruebas que los anteriores modelos.

Entre otras mejoras implementadas por OpenAI, GPT-4.1 es capaz de explorar mejor los repositorios de código, mejorando con ello su integración en equipos de desarrollo, y también su capacidad para generar código que compila y supera las pruebas y las tareas de edición. Para este último caso, el nuevo modelo duplica la puntuación de GPT‑4o en las pruebas, y supera en ocho puntos a GPT‑4.5 al seguir con mayor exactitud los formatos de cambio de líneas.

El límite de salida también se incrementa hasta los 32.768 tokens, facilitando la reescritura completa de archivos cuando resulte imprescindible, al mismo tiempo que el sistema disminuye las ediciones innecesarias: las pruebas internas de OpenAI reducen este tipo de modificaciones del 9% al 2%.

En el ámbito del desarrollo frontend, evaluaciones con verificadores humanos muestran una preferencia del 80% por los desarrollos generados con GPT‑4.1 frente a los realizados con GPT‑4o, tanto por funcionalidad como por estética.

Procesamiento de contextos largos

El salto a un millón de tokens abre la puerta a proyectos que deban analizar grandes bases de código o documentos legales de gran extensión. Desde OpenAI afirman que GPT‑4.1 no solo identifica la información relevante, sino que también consigue relacionar múltiples solicitudes similares y responder con precisión a aquella que corresponda a cada turno de conversación.

Los resultados obtenidos en las pruebas por partners de OpenAI como Windsurf, Qodo o Thomson Reuters confirman, según la compañía, la utilidad del nuevo modelo en tareas de extracción de información y asistencia al desarrollo de software en producción.

Modelos mini y nano: coste y latencia bajo control

La versión GPT‑4.1 mini se presenta como una evolución significativa en el segmento de modelos compactos; mantiene -e incluso supera- la capacidad intelectual de GPT‑4o, reduce la latencia a la mitad y recorta el coste operacional en un 83%, parámetros que resultan clave para integraciones con restricciones presupuestarias.

Por su parte, GPT‑4.1 nano destaca como la opción más ágil y económica dentro del catálogo de OpenAI manteniendo la misma ventana de contexto de un millón de tokens. Su orientación prioritaria abarca tareas de clasificación y autocompletado en las que la velocidad es crítica.

La mayor fiabilidad en el seguimiento de instrucciones y la compresión del contexto, sumadas al soporte del Responses API, favorecen la creación de agentes capaces de operar con un grado superior de autonomía en atención al cliente o análisis documental.

Disponibilidad vía API y en ChatGPT Pro

El nuevo modelo ya se encuentra disponible para su uso a través de la API de OpenAI para integrarlo en aplicaciones a medida o interrogarlo directamente, así como sin restricciones de uso vía la suscripción Pro a ChatGPT, actualmente la más cara con un coste de 200 dólares mensuales.

Aprovechando la ocasión, la suscripción Plus también se ha renovado con la sustitución del modelo 01 por el 03, y de GPT-4 por GPT-4o, así como los modelos 01-mini y o1-mini-high también se han visto sustituidos por sus equivalentes 4o-mini y 4o-mini-high. La suscripción Plus tiene un coste de 20 dólares mensuales.

Con la llegada de la nueva familia, la empresa anuncia la retirada de GPT‑4.5 Preview el 14 de julio de 2025, para facilitar la migración de los desarrolladores, ya que GPT‑4.1 iguala o supera las capacidades clave de aquella versión, pero a menor coste y con menor latencia, lo que, según la compañía, justifica la transición. Desde la firma también han indicado que mantendrán en futuros modelos los aspectos de creatividad y matices de redacción que los usuarios valoraban en GPT‑4.5.