Después de varias generaciones y meses de versiones de prueba, Google ha lanzado sus dos nuevos modelos de medios generativos. La compañía ha anunciado durante el Google I/O de 2025 Veo 3 e Imagen 4, dos IA capaz de crear vídeos e imágenes, respectivamente, con múltiples avances, incluyendo la posibilidad de generar audio con el contenido.
De hecho, una de las novedades más importantes de Veo 3, es el soporte nativo para efectos de sonido, ruidos de fondo o, incluso, diálogos entre los personajes. Se trata del primer modelo de lenguaje en permitir esta función que promete dar un mayor realismo al contenido. Con esto, los usuarios solo deben escribir una breve descripción de lo que quieren que aparezca en el vídeo, y a continuación pedirle que genere un tipo de sonido.
Por ejemplo, si estamos creando un vídeo en el que aparecen dos personajes teniendo una conversación, es posible detallarle a Veo 3 qué queremos que diga cada uno, además de cómo queremos que suene esta voz. En el caso de que sea un vídeo mostrando un paisaje, como un sendero o una montaña, podemos indicarle a la IA que genere junto al vídeo sonidos de hojas moviéndose o pájaros.
Por supuesto, Veo 3 cuenta con una calidad mejorada, incluyendo un mayor realismo, así como múltiples capacidades de generación de contenido. En cualquier caso, recordemos que Veo 2 ya permite crear vídeos de 2 minutos en resolución 4K.
Veo 3 también es el modelo de lenguaje de una nueva herramienta de IA que Google ha anunciado durante el I/O llamada Flow. Esta, de hecho, combina algunos de los modelos de la compañía, incluyendo la mencionada IA de vídeo, Imagen y Gemini, para dar al usuario la posibilidad de crear u obtener clips cinematográficos o diferentes escenas para sus vídeos.
Imagen 4 da un salto brutal en calidad de imagen y ahora es mucho más rápida
En paralelo a Veo 3, la compañía ha anunciado Imagen 4, su nueva generación del modelo capaz de producir imágenes. Google destaca que ahora crea imágenes mucho más rápido, con una versión de hasta 10 veces más veloz que Imagen 3. Por otro lado, también permite generar contenido con una mayor calidad. De hecho, la firma subraya que la IA puede producir un detalle increíble en prácticamente cualquier escenario y estilos, incluyendo en imágenes abstractas, y con una resolución de hasta 2K, lo que lo hace perfecto para impresión o presentaciones.
Imagen 4, además, ahora cuenta con la posibilidad de generar contenidos en diferentes relaciones de aspecto. La IA, por último, también ha mejorado la escritura y la ortografía, para así poder crear imágenes con texto, tales como tarjetas de visitas, invitaciones, etc.
Veo 3 e Imagen 4 están disponibles en la app de Gemini
La nueva versión de Imagen está disponible a partir de hoy en la app de Gemini, y también se integrará en algunas plataformas y herramientas de Google, tales como Slides, Vids o Docs. Por supuesto, todo el contenido que se cree a partir de este modelo tendrá una marca de agua digital llamada SynthID. Esta podrá ser fácilmente reconocible a través de SynthID Detector, una nueva herramienta anunciada en el I/O donde los usuarios podrán subir imágenes o partes de la misma para saber si se trata de contenido generado por la IA de Google.
Veo 3 también estará disponible en la app de Gemini a través de una versión beta. Esta IA, eso sí, será exclusiva para los usuarios que cuenten con un plan a Google IA Ultra, y por el momento solo en Estados Unidos.