Grok 4 destroza los test y apunta a ser el modelo de IA más avanzado. El problema es que Elon Musk sigue saboteando sus respuestas

Publicado el 11/07/2025 por Diario Tecnología

Artículo original

xAI ha lanzado Grok 4, su nuevo modelo de inteligencia artificial que está arrasando en los tests de rendimiento más exigentes del sector. El modelo supera a las propuestas de OpenAI, Google y Anthropic en múltiples benchmarks. Y es que a falta de conocer la estrategia de OpenAI con GPT-5, de momento tiene todas las papeletas de ser el modelo de IA más puntero. Sin embargo, Grok sigue arrastrando los problemas de siempre: respuestas polémicas, contenido ofensivo y un Elon Musk echando mano del modelo para restarle credibilidad.

Los números hablan solos. En el test Humanity's Last Exam, considerado uno de los más difíciles para medir capacidades de IA, xAI afirma que Grok 4 ha logrado un 25,4% sin herramientas adicionales, superando al o3 de OpenAI (21%) y al Gemini 2.5 Pro de Google (21,6%). Pero es con Grok 4 Heavy, su versión multiagente, donde los resultados se disparan: según afirma la empresa, alcanza el 44,4% con ‘herramientas’, casi duplicando a la competencia.

Imagen: xAI

Además, en el benchmark ARC-AGI-2, que mide la capacidad de resolver patrones visuales complejos, Grok 4 ha obtenido un 16,2%, prácticamente el doble que el siguiente modelo comercial. Según Musk, "Grok 4 supera el nivel de doctorado en todas las materias, sin excepción", una afirmación que, aunque suena a marketing, se respalda en los resultados obtenidos.

El enfoque revolucionario. Grok 4 Heavy funciona con un sistema de "agentes múltiples" que trabajan en paralelo sobre el mismo problema, comparando después sus resultados como si fuera un grupo de estudio. Esta arquitectura permite escalar la inteligencia según la potencia computacional disponible, un concepto que podría redefinir cómo entendemos el rendimiento de la IA.

Imagen: xAI

Los problemas de siempre. El lanzamiento de Grok 4 se produce justo después de que la versión anterior del chatbot publicase comentarios antisemitas en X, llegando incluso a identificarse como "MechaHitler" en algunas respuestas. xAI tuvo que retirar temporalmente el servicio y eliminar las publicaciones ofensivas, mientras países como Polonia anunciaban denuncias ante la Comisión Europea y Turquía bloqueaba el acceso al chatbot. La causa fue una modificación en las instrucciones del sistema que permitía al modelo "no rehuir afirmaciones políticamente incorrectas". Aunque xAI retiró esa directriz, el daño ya estaba hecho.

Un sabotaje constante. A pesar de estos avances técnicos, Musk sigue condicionando las respuestas de Grok de formas que comprometen su utilidad. El modelo realiza búsquedas automáticas de las opiniones del magnate en X para responder a temas controvertidos, convirtiendo la supuesta búsqueda de la "verdad" en un eco de las ideas de su creador.

En Xataka

Nvidia alcanzó los 4 billones de dólares de capitalización por una razón: su posición privilegiada en el boom de la IA

Esta práctica, confirmada por expertos en IA como Carlos Santana, demuestra una vez más cómo las polémicas decisiones de Musk están influyendo directamente en el desarrollo del modelo. Además, varios investigadores ya han conseguido eludir fácilmente las barreras de seguridad del modelo, logrando que genere contenido sobre armas químicas, software malicioso, drogas y otros temas sensibles mediante técnicas de jailbreak relativamente sencillas.

Expertos como Ethan Mollick señalan la falta de transparencia de la compañía: no hay documentación técnica detallada, análisis de riesgos o explicaciones sobre cómo evitar futuros incidentes. Esta opacidad dificulta que las empresas confíen en Grok para aplicaciones críticas.

Precios de Grok 4. xAI ofrece Grok 4 básico a un precio de unos 30 dólares al mes. Sin embargo, la compañía también ha lanzado SuperGrok Heavy, una suscripción de 300 dólares mensuales en la que se ofrece su modelo más avanzado y que directamente se convierte en el servicio de IA más caro del mercado.

Lo que viene. xAI planea lanzar un modelo de programación en agosto, agentes multimodales en septiembre y generación de vídeo en octubre. También integrará Grok 4 en los vehículos Tesla la próxima semana, expandiendo el alcance de la IA por todo el ecosistema de Musk. La pregunta es si la compañía logrará separar la excelencia técnica de las controversias mediáticas que la rodean, o si seguirá siendo rehén de las decisiones impulsivas de su fundador.

Imagen de portada | xAI

En Xataka | Sabíamos que la IA generaría nuevos empleos que antes no existían. Lo que no esperábamos es que fuera arreglando sus pifias

utm_campaign=11_Jul_2025"> Antonio Vallejo .

Descarga la app de Diario Tecnología

Últimos posts

Contacto

info@diariotecnologia.es