Claude, la IA favorita de los desarrolladores, lanza las nuevas versiones de sus modelos: trabaja hasta 7 horas sin perder contexto

Publicado el 22/05/2025 por Diario Tecnología
Artículo original

Claude, la IA favorita de los desarrolladores, lanza las nuevas versiones de sus modelos: trabaja hasta 7 horas sin perder contexto

El 2025 marca un hito clave en la evolución de la inteligencia artificial con el lanzamiento de su nueva generación de modelos desarrollados por la startup Anthropic, que ya se posicionan a la vanguardia del sector, desafiando a gigantes como OpenAI y Google. ¿Qué los hace tan especiales? ¿Por qué están siendo adoptados incluso por GitHub (teórico competidor)?

La compañía ha lanzado su esperada serie Claude 4, compuesta por los modelos Claude Opus 4 y Claude Sonnet 4 (la tercera gama de Claude, Haiku, más ligera pero con menos capacidad de contexto, tendrá que esperar algo más para actualizarse).

Presentados durante su primera conferencia de desarrolladores ('Code with Claude'), estos modelos prometen llevar la colaboración entre humanos y máquinas a un nuevo nivel, particularmente en tres ámbitos: el de la programación, el del razonamiento complejo y en el uso de agentes autónomos.

El anuncio de Claude 4 llega en un momento en que competidores como OpenAI, Google y Microsoft también han intensificado su oferta de modelos generativos

Un nuevo estándar en modelos de lenguaje

Claude4

Claude Opus 4, la joya de la corona de Anthropic, es descrito por sus desarrolladores como "el mejor modelo de codificación del mundo", una afirmación esperable en términos de marketing, pero que parece vebir respaldada por resultados en benchmarks como SWE-bench (72,5%) y Terminal-bench (43,2%).

Según afirma la compañía, este modelo ya no es una mera herramienta de autocompletado, sino un colaborador inteligente, capaz de sostener conversaciones, razonar, ejecutar tareas complejas y mantener memoria contextual.

De hecho, este modelo está específicamente diseñado para ejecutar tareas complejas durante horas sin perder coherencia ni rendimiento, un avance notable frente a generaciones anteriores que apenas podían sostener su rendimiento durante una o dos horas.

Rakuten, por ejemplo, ha hecho público que usó Opus 4 para refactorizar código de forma autónoma durante siete horas consecutivas con alto rendimiento.

Por su parte, Claude Sonnet 4 se postula como una evolución significativa de su predecesor 3.7 (justificando así su cambio de numeración): así, alcanza un 72,7% en el benchmark SWE-bench y ofreciendo una mejor respuesta a instrucciones complejas y mayor estabilidad en tareas cotidianas.

Empresas líderes como GitHub, Replit, Cursor, Rakuten y Block ya están integrando estos modelos en sus productos. GitHub, por ejemplo, utilizará Claude Sonnet 4 como base para su nuevo agente de codificación en Copilot
Cursor Cursor también ha celebrado este lanzamiento


Pensamiento extendido y uso de herramientas

Una de las innovaciones más destacadas es la introducción del modo “pensamiento extendido con uso de herramientas”, en el que los modelos pueden alternar entre razonamiento interno y uso de herramientas externas como búsquedas web.

Esta funcionalidad permite una resolución de problemas más sofisticada, combinando pasos de razonamiento con acciones prácticas como ejecutar código o analizar archivos.

Además, ambos modelos pueden usar múltiples herramientas en paralelo, accediendo a archivos locales para construir y mantener memoria contextual a lo largo del tiempo, lo que mejora su desempeño en proyectos largos y continuos.

Claude Code: el nuevo agente de programación

Junto con los modelos, Anthropic ha puesto a disposición de los usuarios su herramienta Claude Code, una interfaz pensada para integrarse con entornos como VS Code y JetBrains, permitiendo programación asistida directamente en el IDE del desarrollador.

Esta herramienta no solo sugiere cambios en tiempo real, sino que también puede operar en segundo plano mediante GitHub Actions, respondiendo a feedback de revisores, corrigiendo errores de CI, y gestionando tareas complejas de desarrollo.

Vía | Anthropic

Imagen | Marcos Merino mediante IA

En Genbeta | "Escribir código no es 'lo aburrido', es mi oficio". Este programador ha vuelto al modo texto para evitar la tentación de la IA

utm_campaign=22_May_2025"> Marcos Merino .