Claude, la IA favorita de los desarrolladores, lanza las nuevas versiones de sus modelos: promete trabajar sola hasta 7 horas
Publicado el 22/05/2025 por Diario Tecnología Artículo original
El 2025 marca un hito clave en la evolución de la inteligencia artificial con el lanzamiento de su nueva generación de modelos desarrollados por la startup Anthropic, que ya se posicionan a la vanguardia del sector, desafiando a gigantes como OpenAI y Google. ¿Qué los hace tan especiales? ¿Por qué están siendo adoptados incluso por GitHub (teórico competidor)?
La compañía ha lanzado su esperada serie Claude 4, compuesta por los modelos Claude Opus 4 y Claude Sonnet 4 (la tercera gama de Claude, Haiku, más ligera pero con menos capacidad de contexto, tendrá que esperar algo más para actualizarse).
Presentados durante su primera conferencia de desarrolladores ('Code with Claude'), estos modelos prometen llevar la colaboración entre humanos y máquinas a un nuevo nivel, particularmente en tres ámbitos: el de la programación, el del razonamiento complejo y en el uso de agentes autónomos.
Un nuevo estándar en modelos de lenguaje

Claude Opus 4, la joya de la corona de Anthropic, es descrito por sus desarrolladores como "el mejor modelo de codificación del mundo", una afirmación esperable en términos de marketing, pero que parece vebir respaldada por resultados en benchmarks como SWE-bench (72,5%) y Terminal-bench (43,2%).
Según afirma la compañía, este modelo ya no es una mera herramienta de autocompletado, sino un colaborador inteligente, capaz de sostener conversaciones, razonar, ejecutar tareas complejas y mantener memoria contextual.
De hecho, este modelo está específicamente diseñado para ejecutar tareas complejas durante horas sin perder coherencia ni rendimiento, un avance notable frente a generaciones anteriores que apenas podían sostener su rendimiento durante una o dos horas.
Rakuten, por ejemplo, ha hecho público que usó Opus 4 para refactorizar código de forma autónoma durante siete horas consecutivas con alto rendimiento.
Por su parte, Claude Sonnet 4 se postula como una evolución significativa de su predecesor 3.7 (justificando así su cambio de numeración): así, alcanza un 72,7% en el benchmark SWE-bench y ofreciendo una mejor respuesta a instrucciones complejas y mayor estabilidad en tareas cotidianas.
Pensamiento extendido y uso de herramientas
Una de las innovaciones más destacadas es la introducción del modo “pensamiento extendido con uso de herramientas”, en el que los modelos pueden alternar entre razonamiento interno y uso de herramientas externas como búsquedas web.
Esta funcionalidad permite una resolución de problemas más sofisticada, combinando pasos de razonamiento con acciones prácticas como ejecutar código o analizar archivos.
Además, ambos modelos pueden usar múltiples herramientas en paralelo, accediendo a archivos locales para construir y mantener memoria contextual a lo largo del tiempo, lo que mejora su desempeño en proyectos largos y continuos.
Claude Code: el nuevo agente de programación
Junto con los modelos, Anthropic ha puesto a disposición de los usuarios su herramienta Claude Code, una interfaz pensada para integrarse con entornos como VS Code y JetBrains, permitiendo programación asistida directamente en el IDE del desarrollador.
Esta herramienta no solo sugiere cambios en tiempo real, sino que también puede operar en segundo plano mediante GitHub Actions, respondiendo a feedback de revisores, corrigiendo errores de CI, y gestionando tareas complejas de desarrollo.
Vía | Anthropic
Imagen | Marcos Merino mediante IA
utm_campaign=22_May_2025"> Marcos Merino .