Project Astra es el ‘Her’ de Google. Y quieren que funcione desde unas gafas de realidad aumentada

Publicado el 14/05/2024 por Diario Tecnología Artículo original

Project Astra es el ‘Her’ de Google. Y quieren que funcione desde unas gafas de realidad aumentada

La avalancha de novedades en los modelos de IA generativa de Google se ha completado con un anuncio muy especial. Project Astra es la ambiciosa iniciativa de Google para plantear el asistente de voz del futuro. Uno potenciado por la IA y por la visión que proporcionan las cámaras de nuestros smartphones (o, como veremos, de otros dispositivos).

Project Astra. Así se llama este ambicioso proyecto de Google con el que quieren "desarrollar agentes de IA universales que puedan ser útiles en nuestra vida cotidiana". En Google destacaban como un asistente de estas características debe ser capaz de entender y responder de la misma forma que lo hacen los humanos. También "recordar lo que ve y oye para entender el contexto y actuar".

La latencia es el reto. Los responsables de la empresa reconocen que han avanzado mucho en la comprensión de información multimodal (esto es, que le llegan datos de texto, de voz, de audio, de vídeo). Sin embargo, "reducir el tiempo de respuesta a algo orientado a la conversación es un reto ingenieril difícil".

Tonos de voz. En Project Astra están trabajando en ofrecer modelos de síntesis de voz que tengan mayor calidad y que permitan que los distintos agentes tengan una amplia variedad de entonaciones. Según Google, los agentes serán capaces de entender el contexto en el que se están usando mejor que nunca, y además responderán rápido.

La app de Gemini en el horizonte. Todo ese aprendizaje acabará integrado en soluciones como la aplicación móvil de Gemini, que será equivalente a la que OpenAI ha presentado con ese ChatGPT basado en GPT-4o que vimos ayer. La aplicación, indican en Google, estará disponible antes de que acabe el año.

Astra

Dime lo que ves. En el vídeo de demostración publicado por Google se veía en funcionamiento una versión preliminar de Project Astra que hacía uso de las cámaras del móvil para reconocer objetos de forma sorprendente. De hecho en Google planteaban opciones curiosas, como las de dibujar una flecha en la pantalla para luego pedirle al modelo que describiera qué era ese objeto en pantalla. Nos recuerda a esa nueva característica de "Rodear para buscar", pero en este caso aplicada a esas consultas en directo sobre cosas que el modelo de IA reconoce.

¡Gafas! Lo más llamativo del vídeo llegó en la parte final, cuando la persona que está realizando la demostración pregunta "¿Dónde he dejado mis gafas". El asistente se lo indica, y cuando se las pone resulta que no son unas gafas de ver normales: ¡son unas gafas con cámara y la integración de Project Astra! (Unas que nos recuerdan a algo, por cierto). A partir de ahí la usuaria hace unas breves demostraciones de cómo gracias a esa integración el modelo va ayudando y respondiendo a las preguntas de la usuaria de forma notable e ingeniosa.

OpenAI va por delante, pero Google acecha. Project Astra parece por tanto ser un competidor directo de las funciones que ayer se presentaron con GPT-4o por parte de OpenAI. La firma liderada por Sam Altman parece haberse adelantado ligeramente porque esas opciones de interacción por voz ya están llegando poco a poco a algunos usuarios, pero su disponibilidad masiva probablemente tarde varias semanas... o meses. Google va ligeramente retrasada, pero esta alternativa parece igual de prometedora y será una interesante forma de animar esta particular competencia. Los ususarios saldremos ganando, eso seguro.

En Xataka | OpenAI acaba de acercarnos más que nunca a 'Her': su nuevo modelo de voz nos acompañará (y quizás enamorará)

-

Google anuncia Veo e Imagen 3 para crear imágenes y vídeos por IA. No es una revolución, pero sigue la estela de Midjourney y Sora

Publicado el 14/05/2024 por Diario Tecnología Artículo original

Google anuncia Veo e Imagen 3 para crear imágenes y vídeos por IA. No es una revolución, pero sigue la estela de Midjourney y Sora

Google ha aprovechado su evento I/O 2024 para anunciar nuevas herramientas de IA generativa: sus nombres son Veo e Imagen 3, y hacen lo que presuponen sus nombres. La primera genera vídeo, la segunda genera imágenes.

Entran así a competir con Midjourney, el futuro Sora y compañía, llevando al territorio creativo sus logros hasta la fecha con Gemini. Ninguno es particularmente revolucionario, pero permite a Google dar un gran paso para mantenerse en la carrera de la generación multimedia sintética.

Imagen 3. El modelo de texto a imagen más avanzado de la empresa, la evolución de Imagen 2.0, puede producir imágenes fotorrealistas, según su presentación y los ejemplos compartidos. Ha mejorado la interpretación del lenguaje natural, y sobre todo, la capacidad de añadir detalles muy específicos a partir de prompts muy extensos.

Esto, según indica Google, permite ofrecer una gama de estilos más amplia y una mayor precisión en la representación visual de la solicitud del usuario. También ha perfeccionado la representación de texto en imágenes para poder lanzar mensajes personalizados con una palabra, una marca, una frase...

Veamos algunos ejemplos mostrados por Google:

Wm Natural Language Elephant Amigurumi Walking In Savanna A Professional Photograph Blurry Background Un elefante amigurumi caminando por la sabana creado con Imagen 3. Imagen: Google.
Wm Photorealism View From Above Of Beautiful River Canyon With Trees Showcasing Its Stunning Natural Beauty With Green Mountains And Blue Waters The Photo Captures The Vastness Of Nature S Creation In The Style Of Its Creation Un paisaje fotorrealista. Imagen: Google.
Wm Photorealism A Close Up Of A Sleek Wolf Perched Regally In Front Of Gray Background In A High Resolution Photograph With Detailed Fine Details Isolated On A Plain Stock Photo With Color Grading In The Style Of A Hyper Realistic Style Otra imagen fotorrealista, esta vez de un lobo, creada con Imagen 3. Imagen: Google.
Wm Text Rendering Word Light Made From Various Colorful Feathers Black Background Texto representado con plumas en Imagen 3. Imagen: Google.

Veo. El modelo de vídeo generativo más grande de Google, claramente evolucionado desde sus orígenes, permite crear clips en resolución 1080p de más de un minuto de duración. Google ha destacado una comprensión profunda del lenguaje natural y de la semántica para producir vídeos que reflejen con precisión lo que el usuario demanda.

También es capaz de entender y aplicar términos cinematográficos, como "timelapse" o "tomas aéreas de paisajes". Es decir: no solo crea el contenido que pidamos, sino que también aplica las técnicas y estilos que deseemos. Y algo más: da un salto importante en cuanto a simulación de la física del mundo real. También renderiza mejor las secuencias en alta definición.

Algunos ejemplos mostrados por Google durante la presentación de Veo. Algunos ejemplos mostrados por Google durante la presentación de Veo. Imagen: Google.

El aspecto ético y legal. Google asegura haber implementado varias medidas de seguridad, filtros y directrices para garantizar que el desarrollo y despliegue de sus modelos sean "responsables".

Por ejemplo, usando SynthID, una herramienta desarrollada por la propia Google que incorpora marcas de agua digitales e imperceptibles para etiquetar el contenido generado por IA.

Disponibilidad. Tanto Veo como Imagen 3 están disponibles en un acceso anticipado privado para algunos creadores seleccionados en VideoFX e ImageFX, existiendo una lista de espera para acceder a ellas. Google planea expandir capacidades de Veo a YouTube Shorts y otros productos.

Esto implica una fuerte vocación de satisfacer a creadores y ofrecerles sus propios productos integrados en estas plataformas.

Google también ha dejado ver un pequeño anticipo de su Music AI Sandbox, un conjunto de herramientas para la creación de canciones y ritmos, apuntando directamente a los artistas.

En Xataka | 36 funciones y cosas que puedes hacer con Google Gemini

Imagen destacada | Google, Mockuuups Studio, Xataka

-

Cómo la "gallina de los limones de oro” se ha convertido en una trampa para el campo español

Publicado el 14/05/2024 por Diario Tecnología Artículo original

Cómo la

Nunca antes el limón español había sido capaz de producir un millón y medio de toneladas. Nunca antes había sido capaz de producir piezas de una calidad tan alta. Nunca antes había estado tan cerca del colapso.

Y es que si se puede hacer historia de muchas formas, el limón español parece haber escogido la más paradójica: la de morir de éxito. Esta es la historia.

Si la vida te da limones... Porque para entender bien el origen del problema, tenemos que remontarnos una década atrás. En los últimos años la situación se ha vuelto insostenible, pero la sequía se instaló en España en 2014.

Desde ese año, en cada temporada hídrica ha llovido menos que la media histórica. Es decir, cada temporada ha sumado su granito de arena para construir "un déficit global, constante y cada vez más extendido". Milagros como el de la primavera de 2018 (con el marzo más lluvioso desde 1965) y las mejoras en la gestión del agua hicieron que las ciudades siguieran su vida normal, pero el campo empezó a ver las señales.

“No había agua, se volvió a los pozos y muchos agricultores empezaron a cambiar los invernaderos y los campos de hortícolas por limoneros”, explicaba Pedro Fuchs en DAP. “Son árboles que permiten usar mano de obra mucho más barata, necesitan menos personal. Aguantan aguas con mucha sal y también pueden estar un mes perfectamente sin recibir riego”.

La trampa y el refugio. Además, durante años, fue un cultivo muy rentable (hace un lustro, se llegó a pagar un euro por kilo). En apenas ocho años, España ha pasado de tener 36.000 hectáreas dedicadas al cultivo del limón a tener 53.000. Parecía el refugio perfecto para un sinfín de pequeños productores y miles de hectáreas de terreno se pasaron al limonar. Parecía. sí. Pero se ha convertido en una trampa.

Centenares de pequeños y medianos agricultores se endeudaron para reconvertir sus campos en limonares. Y durante un tiempo, los margenes y las rentabilidades les sonrieron. Hoy, con el mercado saturado por cientos de miles de toneladas que nadie quiere, no son capaces ni de cubrir costos. Y la inmensa mayoría no han llegado ni a recuperar la inversión.

No es algo que haya pillado por sorpresa al sector. Como explicaba Liliana Fuchs en DAP, las asociaciones sectoriales llevan "desde 2018 avisando al sector mediante notas públicas e informes sobre el exceso de nuevas  plantaciones en un marco de tiempo tan corto que podría traernos a un aumento de producción espectacular como el de esta campaña”.

El problema es que, como ocurrió con la burbuja inmobiliaria, invertir deja de ser "rentable" justo en el momento en que ya no puedes escapar. Esto es lo que les ha pasado a muchos productores que sen ahora, con los árboles cargados de fruto y sin pulmón financiero ni para arrancarlos árboles y volver a plantar otras cosas.

Morir de éxito. Hay más factores (la falta de mercado para un limón de tanta calidad, la llegada de género de fuera de la Unión, los problemas generales del campo, etc...), pero el factor es este: la campaña ha sido tan buena que se ha producido “un efecto embudo del mercado en origen” y los precios se han desplomado.

Ahora queda ver qué pasa con un sector que va como pollo sin cabeza corriendo detrás de la moda hortofrutícola del momento y sin capacidad alguna de maniobra. Sobre todo, porque va a marcar el futuro cercano de la agricultura española.

Imagen | Sharon

En Xataka | Nos encaminamos hacia el chocolate más caro de la historia: cómo la crisis del cacao va a disparar su precio

-

Uno de los miembros más poderosos del Escuadrón Suicida ha revelado por qué se unió al equipo sin ser chantajeado o amenazado por Amanda Waller

Publicado el 14/05/2024 por Diario Tecnología Artículo original

Uno de los miembros más poderosos del Escuadrón Suicida ha revelado por qué se unió al equipo sin ser chantajeado o amenazado por Amanda Waller

El Escuadrón Suicida o Suicide Squad ha contado con muchos miembros a lo largo de su historia. Las películas de David Ayer y James Gunn solo ha mostrado la punta del iceberg. La lista de villanos y personajes de dudosa moralidad que han estado o están atados a Amanda Waller es muy larga. Se cuentan por decenas.

La mayoría de integrantes no acceden a formar parte del Escuadrón Suicida por voluntad propia. Amanda Waller siempre consigue reunir equipos por cualquier medio: chantajes, amenazas, mentiras y promesas que acaban siendo medias verdades. Sin embargo, uno de los integrantes más poderosos en la historia del grupo colabora con ella por una razón tan tierna como trágica.

El personaje Bizarro ha revelado sus motivos para pertenecer voluntariamente al grupo suicida en el cómic Suicide Squad: Dream Team #3 (2024) de Nicole Maines, Eddy Barrows y José Luís. Por si no lo conoces, se trata de un clon Kyptoniano. Posee casi los mismos poderes que Superman, pero viene a ser una versión imperfecta e incluso grotesca del héroe. De hecho, se han partido la cara en varias ocasiones. Su mente está quebrada y suele mostrarse infantil e incluso ingenuo, según la versión.

Bizarro Dc Viñetas de Suicide Squad: Dream Team #3 (2024)
Waller todavía da a Bizarro la posibilidad de ser un héroe.

Sin entrar en spoiler, el cómic cuenta como el Escuadrón Suicida persigue al fugitivo. El Relojero o Clock King habla sobre lo poderoso que es su objetivo. Sin embargo, Bizarro no está de acuerdo. Y aquí es donde revela su motivación: señala que Waller tiene todo lo que necesita con su poder y que le sirve debido a que le hace sentir tan querido y necesitado como el verdadero Superman. En otras palabras: Bizarro se unió al Escuadrón Suicida para ser el héroe que quiere ser, como indica ScreenRant, aunque con consecuencias desastrosas que Superman debe arreglar.

En VidaExtra | Suicide Squad me ha devuelto todo el terror que he infundido como Batman a lo largo de 15 años y pudo ser mucho peor

En VidaExtra | La loca historia de Superman Lives contada por Kevin Smith, la peor película de DC que (por suerte) jamás se rodó

En VidaExtra | Todas las películas de DC Studios: de Dioses y Monstruos a los Elseworlds, incluyendo el universo de Zack Snyder

-

En pleno boom, un nuevo tipo de alojamiento turístico se abre paso en Canarias: las autocaravanas de alquiler

Publicado el 14/05/2024 por Diario Tecnología Artículo original

En pleno boom, un nuevo tipo de alojamiento turístico se abre paso en Canarias: las autocaravanas de alquiler

El papel de las autocaravanas en Canarias resulta, cuanto menos, peculiar. La escasez y el elevado coste de la vivienda en el archipiélago, sometido a una intensa presión turística, las convirtió en su día en la alternativa asequible para quienes no podían pagar un alquiler convencional. A falta de casa o piso al uso, buena era una caravana o furgoneta camperizada. Ahora estos vehículos han pasado a destinarse a otros uso bastante distinto: el alquiler vacacional para turistas. En Arona, una localidad del sur de Tenerife, ya han identificado algunos casos. E incluso hay quien asegura que se están empleando también para ejercer la prostitución.

Lo más curioso es que las autocaravanas no solo han llamado la atención de las autoridades canarias. Algo similar ha ocurrido también en las Baleares. 

Caravana no, piso de vacaciones.

Gemini evoluciona con su modelo más rápido hasta la fecha y grandes planes para teléfonos móviles

Publicado el 14/05/2024 por Diario Tecnología Artículo original

Gemini evoluciona con su modelo más rápido hasta la fecha y grandes planes para teléfonos móviles

Estamos en pleno Google I/O y, como parte de la batería de novedades presentadas por la compañía, llegan mejoras en Gemini 1.5. Gemini una familia de modelos de inteligencia artificial que potencia tecnologías como el nuevo asistente de voz que vendrá para remplazar a Google Assistant, por lo que las mejoras en los tiempos de ejecución del modelo resultan cruciales para sus diversas implementaciones (ya sea en web, apps o asistentes).

Actualmente, Gemini tiene tres versiones: Ultra, Pro y Nano. Ultra es el principal rival de GPT4, Pro compite con soluciones gratuitas como GPT 3.5, y Nano es la integración que vemos en dispositivos con IA de Google integrada como los Google Pixel 8 o los Samsung Galaxy S24. Las novedades de este IO se centran en Gemini 1.5 , disponible a través de la suscripción Gemini Advanced.

Un modelo más ligero y rápido. Gemini Flash es el nombre que ha dado Google a su propuesta más ligera, con menor latencia y, sobre todo, veloz. Es una apuesta con una capacidad de respuesta más rápida que 1.5 Pro, diseñado para aquellas aplicaciones en las que lo que prima es la celeridad.

Supone la última incorporación a la familia de modelos Gemini, y está optimizado para tareas de gran volumen. Pese a ser más ligero que Pro, Google promete una gran capacidad de razonamiento multimodal, siendo especialmente bueno en resúmenes, aplicaciones de chat, subtitulación de imágenes o extracción de datos en documentos.

Flash Utility

Mejoras en la capacidad de cálculo. Gemini 1.5 Pro es un modelo que aumenta la capacidad de cálculo respecto a versiones anteriores. Ahora es capaz de de analizar documentos de gran tamaño: archivos de hasta 1.500 páginas en total, resumen de hasta 100 correos electrónicos de forma simultánea, una hora de vídeo o bases de código de más de 30.000 líneas.

Dado que la principal bondad de Gemini 1.5 Pro es esta capacidad de cálculo, Google quiere una mayor integración de Drive con Gemini, permitiendo subir archivos de este último servicio a Gemini. En otras palabras, podremos acceder al poder de cálculo de Gemini 1.5 Pro en los documentos.

Mejoras en la comprensión de imágenes. Gemini 1.5 Pro promete importantes mejoras a la hora de entender las imágenes que le estamos mostrando. Como ejemplo, Google presume de que su modelo puede resolver problemas matemáticos paso a paso con tan solo analizar una foto, o darte recetas de un plato con tan solo ver su composición y aspecto.

No solo aplica a multimedia: también a apps. Gemini será capaz de analizar el contenido de aplicaciones como Google Meet o Gmail para hacer resúmenes, descripciones de lo que ve transcritas a texto y más funciones.

Gemini 1.5 Pro estará disponible para los suscriptores de Gemini Advanced en algo más de 150 países y en más de 35 idiomas. Desde Google nos han confirmado que la suscripción llegará a España.

Google Fotos

Gemini será más compatible con móviles. Con el fin de mejorar las capacidades conversacionales de Gemini, Google anuncia el lanzamiento de Gemini Live para los suscriptores de Gemini Advanced, así como nuevas funciones que integrarán Gemini en Android.

Entre ellas, llegará la búsqueda mediante IA a Google Fotos, pudiendo analizar el contexto de las mismas, hablarnos sobre lo que ve, e ir mucho más allá de la actual búsqueda. También habrá integración de Gemini en apps como Mensajes, donde servirá de apoyo para las conversaciones.

Respecto a Gemini Live, es una nueva interfaz de conversación con Gemini exclusiva para teléfonos móviles. Al igual que mostró hace unas horas OpenAI con GPT-4o, podremos interrumpir al bot, como en una conversación habitual.

Del mismo modo, Gemini Live puede ver a través de nuestra cámara, describiendo con precisión el entorno en el que estamos. Estas novedades por el momento, se están probando en inglés, por lo que no llegarán en primera instancia a España.

Mejoras en la planificación. Además de las mejoras que llegan de la mano de Gemini Flash, Gemini Live, y las capacidades de Gemini Pro, Google quiere dotar a Gemini Advanced de mejoras en planificaciones complejas. Itinerarios de viaje, planes, actividades en las que tenemos que escoger entre diversas opciones, etc.

Una de las funciones que llegará al plan Advanced dentro de "los próximos meses" tendrá que ver con las planificaciones. Si, por ejemplo, le pedimos que nos planifique un viaje, será capaz de tener en cuenta los horarios de vuelo, llegada a hotel, preferencias de comida que le indiquemos e demás para ofrecernos una planificación personalizada.

Lo hará obteniendo datos de apps como Gmail, Google Maps y la búsqueda de Google, y modificará la planificación completa si hacemos algún cambio en el itinerario.

Imagen | Google

En Xataka | 36 funciones y cosas que puedes hacer con Google Gemini

-

Project Astra es el ‘Her’ de Google. Y quieren que funcione desde unas gafas

Publicado el 14/05/2024 por Diario Tecnología Artículo original

Project Astra es el ‘Her’ de Google. Y quieren que funcione desde unas gafas

La avalancha de novedades en los modelos de IA generativa de Google se ha completado con un anuncio muy especial. Project Astra es la ambiciosa iniciativa de Google para plantear el asistente de voz del futuro. Uno potenciado por la IA y por la visión que proporcionan las cámaras de nuestros smartphones (o, como veremos, de otros dispositivos).

Project Astra. Así se llama este ambicioso proyecto de Google con el que quieren "desarrollar agentes de IA universales que puedan ser útiles en nuestra vida cotidiana". En Google destacaban como un asistente de estas características debe ser capaz de entender y responder de la misma forma que lo hacen los humanos. También "recordar lo que ve y oye para entender el contexto y actuar".

La latencia es el reto. Los responsables de la empresa reconocen que han avanzado mucho en la comprensión de información multimodal (esto es, que le llegan datos de texto, de voz, de audio, de vídeo). Sin embargo, "reducir el tiempo de respuesta a algo orientado a la conversación es un reto ingenieril difícil".

Tonos de voz. En Project Astra están trabajando en ofrecer modelos de síntesis de voz que tengan mayor calidad y que permitan que los distintos agentes tengan una amplia variedad de entonaciones. Según Google, los agentes serán capaces de entender el contexto en el que se están usando mejor que nunca, y además responderán rápido.

La app de Gemini en el horizonte. Todo ese aprendizaje acabará integrado en soluciones como la aplicación móvil de Gemini, que será equivalente a la que OpenAI ha presentado con ese ChatGPT basado en GPT-4o que vimos ayer. La aplicación, indican en Google, estará disponible antes de que acabe el año.

Captura De Pantalla 2024 05 14 A Las 18 36 20 Esas gafas que lleva esta ingeniera de Google tienen integrada la tecnología de Project Astra. Esto promete.

Dime lo que ves. En el vídeo de demostración publicado por Google se veía en funcionamiento una versión preliminar de Project Astra que hacía uso de las cámaras del móvil para reconocer objetos de forma sorprendente. De hecho en Google planteaban opciones curiosas, como las de dibujar una flecha en la pantalla para luego pedirle al modelo que describiera qué era ese objeto en pantalla. Nos recuerda a esa nueva característica de "Rodear para buscar", pero en este caso aplicada a esas consultas en directo sobre cosas que el modelo de IA reconoce.

¡Gafas! Lo más llamativo del vídeo llegó en la parte final, cuando la persona que está realizando la demostración pregunta "¿Dónde he dejado mis gafas". El asistente se lo indica, y cuando se las pone resulta que no son unas gafas de ver normales: ¡son unas gafas con cámara y la integración de Project Astra! (Unas que nos recuerdan a algo, por cierto). A partir de ahí la usuaria hace unas breves demostraciones de cómo gracias a esa integración el modelo va ayudando y respondiendo a las preguntas de la usuaria de forma notable e ingeniosa.

OpenAI va por delante, pero Google acecha. Project Astra parece por tanto ser un competidor directo de las funciones que ayer se presentaron con GPT-4o por parte de OpenAI. La firma liderada por Sam Altman parece haberse adelantado ligeramente porque esas opciones de interacción por voz ya están llegando poco a poco a algunos usuarios, pero su disponibilidad masiva probablemente tarde varias semanas... o meses. Google va ligeramente retrasada, pero esta alternativa parece igual de prometedora y será una interesante forma de animar esta particular competencia. Los ususarios saldremos ganando, eso seguro.

En Xataka | OpenAI acaba de acercarnos más que nunca a 'Her': su nuevo modelo de voz nos acompañará (y quizás enamorará)

-

La IA generativa llega a los resultados de Google, que ahora quiere "buscar por ti"

Publicado el 14/05/2024 por Diario Tecnología Artículo original

La IA generativa llega a los resultados de Google, que ahora quiere

Google ha aprovechado su evento para desarrolladores, el I/O 2024, para hacer varios anuncios sobre novedades en sus servicios, incluido su buscador. En este caso, ha comunicado cómo van a ser las búsquedas a partir de ahora en su producto rey.

Por supuesto, la IA generativa es la piedra angular de este cambio. Y con él nos despedimos de los resultados tradicionales, con los diez enlaces en color azul rodeados de snippets en los últimos años.

Por qué importa. Google es el rey absoluto de las búsquedas y la principal vía de negocio de Alphabet. Es la forma esencial de acceder a Internet y de descubrir contenido para miles de millones de personas. Pocos cambios en el mundo online tienen tanto impacto como los que haga Google.


Visión general. Google está integrando Gemini en sus resultados de búsqueda. Ya no solo devolverá enlaces y snippets a nuestras palabras clave, también dará respuestas elaboradas a consultas realizadas en lenguaje natural.

Con una interfaz similar a la de los snippets, pero con su propia entidad, estos resultados sintéticos se ajustarán a lo que el usuario pide. Algunos ejemplos:

  • "Explica la conexión entre los rayos y los truenos" → El primer resultado será una caja de texto que lo explique brevemente.
  • "Crea un plan de tres comidas fáciles de hacer para un grupo" → Veremos tres propuestas con la imagen de cada receta, podremos reemplazar cada una si queremos otra, y veremos las instrucciones para preparar cada una.
  • "Encuentra las mejores escuelas de yoga en Boston, con al menos un promedio de 4.1 en sus valoraciones, a menos de media hora a pie de mi trabajo" → La búsqueda se centra en mostrar escuelas de yoga que se ajusten a esa descripción.
Google 2 Imagen: Google.
Ai Overviews Meal Planning Still Imagen: Google.
Ai Overviews Break It Down Still Imagen: Google.

Es decir: combina imágenes, mapas, enlaces y cualquier tipo de información para hacer una planificación. Los ejemplos son muy concretos, son funciones específicas desarrolladas por Google para estos resultados.

También en vídeo. Gemini en Google permitirá a los usuarios adjuntar vídeos para las búsquedas que sean complicadas de describir con palabras. Por ejemplo, añadiendo el vídeo de un dispositivo electrónico averiado para que el buscador intente detectar el fallo y le indique la forma de repararlo.

Lanzamiento escalonado. Estas nuevas funciones están disponibles inicialmente en inglés y en Estados Unidos, pero hay planes de expansión a otras regiones e idiomas. Google permite inscribirse en sus Search Labs para el acceso anticipado a estas funciones.

En Xataka | 36 funciones y cosas que puedes hacer con Google Gemini

Imagen destacada | Google, Mockuuups Studio, Xataka

-

Un jugador de Fallout 4 se ha encontrado con 99 millones de chapas y asegura no haber utilizado mods y ningún truco

Publicado el 14/05/2024 por Diario Tecnología Artículo original

Un jugador de Fallout 4 se ha encontrado con 99 millones de chapas y asegura no haber utilizado mods y ningún truco

En el mundo postapocalíptico de Fallout hay que reconocer que escasean todos los tipos de recursos, de ahí que cualquier artículo o material sea tan importante. Pero si hay uno que sobresale por encima de todos son las chapas de las botellas, ya que están consideradas como la moneda de cambio que se utiliza en este universo.

El hecho de que sean tan demandadas implica que no abunden considerablemente, de ahí su rareza y que sean tan codiciadas. No obstante, hay un jugador que ahora puede presumir de haberse encontrado con el mayor premio de toda su vida, porque mientras estaba jugando a Fallout 4 ha conseguido de golpe nada más y nada menos que 99 millones de chapas.

Desde luego, su cara de sorpresa ante este hecho tuvo que ser digna de enmarcar. Además, no hizo nada en especial, ya que simplemente estaba combatiendo contra un enemigo. Una vez derrotado se puso a examinar sus bolsillos para extraer sus pertenencias, momento en el que se encontró con unos cuantos artículos y con semejante cantidad de dinero que llevaba encima.

Resulta curioso que alguien estuviese viajando por el Yermo con tantísimos millones de chapas. Aun así, Arkayne97, el usuario que ahora puede presumir de ser el hombre más rico de todos, no dudo en sacar una foto a la pantalla para mostrar el premio gordo que le ha tocado, ya que queda claro que el dinero no volverá a ser un problema para él nunca más.

No son pocos los usuarios que han comentado a la publicación quedándose a cuadros, entre los que no han faltado algunos acusándole de haber hecho trampas o de haber realizado alguna modificación en el juego. No obstante, él mismo ha garantizado que en ningún momento ha llevado a cabo algún truco y tampoco ha empleado ningún tipo de mod, prometiendo que todo es legítimo. Eso sí, no descarta que se haya podido deber a un error, aunque de ser así, bendito fallo.

En VidaExtra | He encontrado el lugar perfecto de Fallout 76 para establecer mi campamento: apartado, seguro y con vistas a los petardazos nucleares

En VidaExtra | He flipado mientras exploraba Skyline Valley, la nueva zona de Fallout 76, y ahora solo quiero que se lance para desvelar sus misterios

En VidaExtra | Fui a comprar algunos planos de Fallout 76 y acabé perdido en un búnker enorme digno de una película de Hollywood

-

OpenAI revolucionó la IA generativa con DALL-E 3 y Sora. Google ya tiene grandes respuestas: Imagen 3 y Veo

Publicado el 14/05/2024 por Diario Tecnología Artículo original

OpenAI revolucionó la IA generativa con DALL-E 3 y Sora. Google ya tiene grandes respuestas: Imagen 3 y Veo

Entre todas las novedades anunciadas en su evento Google I/O, la compañía ha anunciado el lanzamiento de dos nuevos modelos de inteligencia artificial generativa: Veo, su modelo más avanzado para la generación de videos en alta definición, e Imagen 3, su modelo de texto a imagen de mayor calidad hasta la fecha.

Veo: una alternativa a Sora

Veo es el modelo de generación de video más avanzado de Google hasta la fecha. Este modelo es capaz de crear vídeos en alta definición (1080p) que pueden durar más de un minuto, cubriendo una amplia gama de estilos visuales y cinematográficos.

Pero lo más relevante es la consistencia y coherencia del metraje generado por Veo, con personas, animales y objetos que se mueven de manera realista a lo largo de las tomas.

Además, gracias a su comprensión avanzada del lenguaje natural y la semántica visual, Veo puede generar videos que reflejan fielmente la visión creativa del usuario, siendo capaz de entender términos cinematográficos como "timelapse" o "tomas aéreas de un paisaje", y ofreciendo así un control creativo sin precedentes.

Google ha estado invitando a cineastas y creadores a experimentar con Veo, a imagen y semejanza de lo que ha estado haciendo OpenAI con Sora. Un ejemplo de esto es la colaboración con el cineasta Donald Glover y su estudio creativo Gilga, quienes ya han experimentado con Veo en un proyecto cinematográfico.

Imagen 3: Dando batalla a DALL-E 3

Wm Text Rendering Word Light Made From Various Colorful Feathers Black Background

El modelo Imagen 3 de Google es su modelo de IA de texto-a-imagen (como MidJourney o DALL-E 3) de mayor calidad hasta la fecha: Imagen 3 genera imágenes fotorrealistas y detalladas con menos 'artefactos' (defectos) visuales que sus predecesores.

Este modelo no solo entiende mejor el lenguaje natural y la intención detrás de los prompts introducidos por los usuarios, sino que también incorpora pequeños detalles que mejoran la fidelidad de las imágenes generadas.

Imagen 3 es especialmente eficaz renderizando texto dentro de las imágenes (ver imagen anterior), una capacidad que abre nuevas posibilidades como la creación de mensajes de cumpleaños personalizados o diapositivas para presentaciones.

Al igual que Veo, Imagen 3 está disponible en vista previa privada para un grupo selecto de creadores dentro de ImageFX (con la posibilidad de unirse a la lista de espera) y próximamente estará disponible en Vertex AI.

En Genbeta | Esta inteligencia artificial te permite crear todo tipo de imágenes 3D con tu nombre gratis y con intentos ilimitados: así funciona

-

Página Siguiente