Gemini ahora puede ver y entender todo lo que nos rodea. Y lo hará gratis en cualquier Android y iPhone
Publicado el 20/05/2025 por Diario Tecnología Artículo original
El Google I/O 2025 ha dejado clara una cosa: Gemini es el centro de toda la estrategia de inteligencia artificial de Google. La compañía ha redoblado su apuesta por esta tecnología presentando importantes novedades, entre ellas un nuevo plan de suscripción llamado Gemini AI Ultra, con un precio de 249,99 dólares al mes, que ha roto todos los esquemas del mercado.
Pero más allá de la polémica por el precio, el evento ha traído nuevas funciones y capacidades que buscan hacer de Gemini una IA más potente, útil e integrada que nunca. Además, Google ha anunciado la llegada de Gemini 2.5 Flash a todos los usuarios, tras estar en preview siendo un modelo más eficiente al reducir el coste por token.
Gemini 2.5: así mejora el modelo de Google
Audio nativo. Hasta ahora era posible hablarle a Gemini usando la voz, pero las respuestas se ofrecían únicamente por escrito. Esto cambia con la integración de audio nativo, que permite mantener una conversación en tiempo real con la IA. En esencia, se busca que la interacción sea natural, rápida y completamente verbal, como si se tratara de un asistente inteligente tradicional... pero mucho más avanzado.

Gemini Live. La nueva función Gemini Live, disponible en Android e iOS, permitirá compartir la pantalla del dispositivo o activar la cámara para que la IA interprete lo que ve.

Sorprendentemente, esta función será gratuita, sin necesidad de contar con el plan Ultra. Además, se integrará con otras herramientas del ecosistema Google, como Google Calendar, para generar eventos, recordatorios o tareas al instante a partir de lo que Gemini detecte.

Producción de recursos visuales con Imagen 4 y vídeos con Veo 3. Una función que de momento va a estar reservada únicamente para los usuarios de Google AI Ultra en Estados Unidos. Image 4 es el nuevo modelo de generación de imágenes que promete una gran calidad en el resultado, así como rapidez a la hora de renderizar el prompt.
Veo 3 por su lado, es el nuevo modelo de generación de vídeo, que según Google es el primero en soportar de manera nativa los efectos de voz o incluso crear un auténtico pódcast. Si bien, para este modelo habrá que estar en Estados Unidos y también contar con suscripción a Google AI Ultra.
Deep Research se enriquece con documentos propios. Desde ya, la herramienta Deep Research de Gemini permite cargar archivos PDF e imágenes para que la IA trabaje directamente con nuestros documentos. Esto permitirá realizar investigaciones más precisas y personalizadas, utilizando material propio como base de análisis.
Gemini en Chrome. A partir de mañana, los usuarios del plan Ultra en Estados Unidos podrán usar Gemini directamente en Google Chrome. Esto supone un paso más hacia la integración total de la IA, permitiendo analizar el contenido de las webs visitadas y realizar tareas directamente desde el navegador, como búsquedas inteligentes, resúmenes o sugerencias de acción.
Gemini se extiende por todo el ecosistema de Google
Gmail se beneficia especialmente de las mejoras. Ahora, Gemini podrá analizar todo el historial de conversación para generar respuestas personalizadas y contextuales, además de ofrecer funciones como la eliminación inteligente de correos irrelevantes (“Elimina todos los correos no leídos de Pepe López”), la programación rápida de citas o la confirmación de reuniones sin salir del hilo de correos.
Gemini también se integra más profundamente en Docs, y especialmente en Presentaciones, donde se suma la herramienta Google Vids. Con esta, se podrá convertir cualquier presentación en un vídeo atractivo, generando automáticamente guiones, voces en off, animaciones e incluso editando las partes menos dinámicas de un vídeo ya grabado para hacer más efectiva la comunicación.
Estas novedades demuestran que Google no quiere quedarse atrás en la carrera por liderar la inteligencia artificial generativa. Gemini ahora no solo compite con ChatGPT o Claude en generación de texto, sino que busca ser el asistente inteligente transversal que vive en tu móvil, en tu navegador, en tu bandeja de entrada y hasta en tus presentaciones. Todo ello, con un modelo de negocio que se atreve a escalar el precio hasta los 250 dólares mensuales.
En Genbeta | He probado esta app española que usa ChatGPT para ayudarte a buscar piso y ya no vuelvo a usar Idealista
utm_campaign=20_May_2025"> José Alberto Lizana .