Anthropic saca pecho tras el aluvión de Google en IA: lanza el que dice que es el mejor modelo de programación del mundo

Publicado el 22/05/2025 por Diario Tecnología
Artículo original

Anthropic saca pecho tras el aluvión de Google en IA: lanza el que dice que es el mejor modelo de programación del mundo

Después de que Google desplegara toda su artillería en inteligencia artificial, Anthropic no ha querido quedarse atrás. La compañía fundada por Dario Amodei ha movido ficha con fuerza: ha presentado Claude Opus 4 y Claude Sonnet 4, dos nuevos modelos con los que aspira a dejar su huella en la carrera por la IA.

La estrella del anuncio es Claude Opus 4, el modelo más avanzado que ha desarrollado Anthropic hasta ahora. Y no se andan con rodeos: aseguran que es "el mejor modelo de programación del mundo. Una afirmación ambiciosa que, como siempre, habrá que poner a prueba. Pero los primeros datos lo sitúan muy bien posicionado frente a sus principales rivales.

Bechmarks

En el benchmark SWE-bench Verified, que evalúa tareas reales de ingeniería de software, Opus 4 consigue un 72,5 % en condiciones estándar y llega hasta el 79,4 % si se habilita el procesamiento paralelo. Es un rendimiento que lo deja por encima de modelos como GPT-4.1 (54,6 %), o3 (69,1 %) o el reciente Gemini 2.5 Pro de Google (63,2 %).

Ahora bien, en otras pruebas más exigentes en razonamiento multimodal, como GPQA Diamond o MMMU, centradas en preguntas de nivel universitario y escenarios complejos que combinan texto e imagen, Opus 4 no consigue superar a o3, que sigue liderando en ese terreno.

Un modelo con resistencia y autonomía

Pero más allá de los números, lo que Anthropic quiere destacar es la resistencia y autonomía de este modelo. Claude Opus 4 es capaz de mantener sesiones de trabajo largas y ejecutar miles de pasos de forma continuada. Desde la empresa explican que esto lo convierte en una base ideal para agentes de IA más sofisticados: sistemas que toman decisiones, completan tareas por su cuenta y no necesitan supervisión humana constante.

En paralelo llega Claude Sonnet 4, una evolución del modelo que Anthropic lanzó en febrero. No está pensado para competir con Opus en potencia, pero sí ofrece una propuesta muy equilibrada entre rendimiento y eficiencia. En codificación también da un salto importante respecto a su versión anterior: pasa del 62,3 % al 72,7 % en SWE-bench Verified, y mejora en tareas de razonamiento, seguimiento de instrucciones y precisión general.

Ambos modelos llegan con novedades interesantes. Por ejemplo, ahora pueden alternar entre razonamiento y uso de herramientas dentro de un mismo proceso, lo que permite respuestas más completas. También han mejorado en fiabilidad. Según Anthropic, son un 65 % menos propensos a tomar atajos o a cometer errores graves que Sonnet 3.7.

Claude Opus 4 y Sonnet 4 ya están disponibles en la API de Anthropic, en Amazon Bedrock y en Google Cloud Vertex AI. Están incluidos en los planes Pro, Max, Team y Enterprise. Los precios se mantienen en la línea de los modelos anteriores: Opus 4 cuesta 15 dólares por millón de tokens de entrada y 75 por millón de tokens de salida. Sonnet 4 es más asequible: 3 y 15 dólares respectivamente. Este último también puede utilizarse desde cuentas gratuitas.

Imágenes | Anthropic

En Xataka | Hemos probado el nuevo modo IA de Google: es una bala directa a los enlaces azules que inquieta y emociona a partes iguales

utm_campaign=22_May_2025"> Javier Marquez .