El lanzamiento de Claude 3.7 Sonnet representa, según apuntan desde la misma Antrophic, un avance en la integración de razonamiento híbrido dentro de un mismo modelo. Con la posibilidad de ofrecer respuestas casi instantáneas o de desplegar reflexiones detalladas visibles para la persona que interactúa con el modelo, la nueva versión de Claude AI busca flexibilizar el uso de la inteligencia artificial según las necesidades de cada proyecto.
Así mismo, también incluye un control más preciso para limitar el tiempo y los recursos que dedica a pensar antes de responder.
En su modo estándar, Claude 3.7 Sonnet actúa de forma similar a su predecesor, aunque con mejoras sustanciales en el ámbito de la programación y el desarrollo web. Mientras tanto, la modalidad de extended thinking hace que el sistema revise sus procesos para lograr respuestas que, de acuerdo con la información disponible, benefician el desempeño en tareas de matemáticas, física o interpretación de instrucciones complejas. Además, el modelo mantiene un coste idéntico al anterior, con 3 dólares por cada millón de tokens de entrada y 15 dólares por millón de tokens de salida, incluyendo los tokens usados en la reflexión.
Una filosofía de razonamiento unificado
La estrategia planteada por Anthropic consiste en equiparar las rápidas reacciones de los humanos con la posibilidad de realizar reflexiones más profundas dentro de un mismo sistema. Para ello, se ofrece la opción de restringir o ampliar la cantidad de tokens destinados al proceso de pensamiento, lo que permite equilibrar velocidad y calidad de respuesta. En lugar de centrarse en problemas de competición, la compañía afirma haber priorizado aplicaciones reales para entornos de negocio.
Durante las pruebas iniciales, distintos grupos especializados en desarrollo habrían encontrado evidencias de un mayor rendimiento a la hora de gestionar proyectos de software que requieren integración de herramientas avanzadas. Quienes han experimentado con el modelo en tareas de planificación y actualizaciones en pila completa han informado que la modalidad reflexiva contribuye a resolver con mayor eficacia los cambios requeridos, aunque siempre de forma sujeta al presupuesto de tokens que se fije en cada caso.
Claude Code y la colaboración directa con el terminal
Otro lanzamiento anunciado con esta versión es Claude Code, una herramienta que, en una fase preliminar de investigación, brinda un asistente autónomo para tareas de programación desde la línea de comandos. El objetivo es posibilitar que Claude realice búsquedas y lecturas de código, edite archivos, ejecute pruebas y haga commits en repositorios, manteniendo siempre al usuario al tanto de sus acciones.
Según los responsables del proyecto, Claude Code ya se ha empleado internamente para optimizar tareas de test-driven development, diagnóstico de problemas complejos, y refactorizaciones a gran escala. En esos entornos controlados, aseguran haber reducido el tiempo de ciertos procesos de 45 minutos a una sola acción. Se prevé que el equipo perfeccione las llamadas a herramientas, incluya soporte para comandos de larga duración y mejore la representación en pantalla a medida que el producto avance hacia una versión más completa.
En paralelo, la integración con GitHub se extiende ahora a todos los planes de Claude, lo que, de acuerdo a la información disponible, facilita la vinculación entre repositorios de código y el modelo, con la expectativa de mejorar la experiencia de desarrollo en proyectos tanto privados como de código abierto.
Seguridad y perspectivas de futuro
La presentación del modelo incorpora también un enfoque detallado sobre su fiabilidad y resiliencia ante posibles usos indebidos. Se han realizado evaluaciones junto con especialistas independientes para reforzar los mecanismos de seguridad y reducir en un 45% la tasa de negativas innecesarias frente a solicitudes legítimas.
La nueva system card analiza los resultados de estas evaluaciones y describe los esfuerzos por bloquear vulnerabilidades como los llamados ataques de inyección de prompts. Además, aborda la cuestión de la transparencia en la toma de decisiones de los modelos y si su capacidad de razonar en voz alta puede brindar una visión más clara de su fiabilidad. Las conclusiones y la metodología propuestas en dicho documento pueden ser adoptadas por otros laboratorios y equipos de investigación en el ámbito de la IA.
Mirando hacia el futuro, el lanzamiento de Claude 3.7 Sonnet y Claude Code busca ampliar las posibilidades de colaboración entre humanos y máquinas, ofreciendo un sistema capaz de responder tanto con inmediatez como con reflexiones más pormenorizadas.
Desde Anthropic se contempla la mejora continua del modelo mediante el análisis de casos de uso reales y la retroalimentación directa de la comunidad de desarrolladores, en un intento de acercar la inteligencia artificial a las necesidades más prácticas del entorno empresarial.
Claude 3.7 Sonnet se encuentra disponible en los planes Free, Pro, Team y Enterprise, así como en la Anthropic API, Amazon Bedrock y Google Cloud Vertex AI. La modalidad extended thinking no está habilitada en el plan gratuito.