Google expande la creación de vídeo con IA a través de Gemini y Whisk

Las nuevas funciones, disponibles para suscriptores de Gemini Advanced y Google One AI Premium, facilitan la transformación de descripciones de texto en clips de alta resolución y la animación de imágenes preexistentes.
17 de abril, 2025

En el marco del evento Google Cloud Next 2025 en Las Vegas, este pasado martes día 15, Google anunció la incorporación de Veo 2 a la plataforma Gemini, una mejora que permite al chatbot de inteligencia artificial generar vídeos breves de ocho segundos en formato MP4 y calidad 720p.

La novedad también llega a Whisk, el experimento de Google Labs dedicado a la creación de imágenes mediante texto y ahora capaz de animarlas con resultados más realistas. Con este lanzamiento, la compañía busca agilizar la producción de contenido audiovisual y ampliar las posibilidades creativas de los usuarios sin necesidad de herramientas profesionales.

La propuesta ofrece un modo de compartir resultados de manera rápida en dispositivos móviles, integrándose con servicios populares de contenido audiovisual. Además, se ha establecido un límite mensual de vídeos que pueden generarse, con notificaciones que avisan a los usuarios cuando se aproximan al máximo permitido.

Nuevas capacidades de vídeo en Gemini

Veo 2 introduce un enfoque centrado en la fluidez de movimiento y la recreación de escenas variadas, integrando una interpretación detallada de la física real. El sistema ha sido concebido para reflejar con mayor precisión el comportamiento humano y de distintos entornos, produciendo resultados que buscan acercarse al realismo cinematográfico.

Los suscriptores de Gemini Advanced pueden describir la escena que desean plasmar, ya sea un relato breve, un concepto visual o una idea específica. Cuanta más información incluyan, mayor control podrán ejercer sobre el resultado final. Con esta funcionalidad, Google pretende simplificar el proceso de creación, de modo que no se requiera software especializado o experiencia previa en edición.

Whisk Animate: imágenes convertidas en clips

Whisk es una plataforma de experimentación que emplea modelos de inteligencia artificial para materializar ideas basadas en descripciones escritas o referencias visuales. Desde este mismo mes, los usuarios de Google One AI Premium disponen de Whisk Animate, una extensión capaz de generar vídeos de ocho segundos a partir de imágenes elaboradas en la propia herramienta. La integración de Veo 2 permite conseguir secuencias animadas a partir de material estático, con un nivel de detalle pensado para distintos estilos estéticos.

Estas innovaciones se encuentran disponibles a escala global y en todos los idiomas que Gemini admite. Google Labs refuerza así el ecosistema de creación de contenidos, proporcionado tanto a creadores ocasionales como a profesionales una vía rápida y accesible para el desarrollo de proyectos audiovisuales.

Seguridad y control de contenidos

Para la compañía, el compromiso con la seguridad en la generación de vídeo abarca la evaluación previa y la prevención de usos inapropiados o que vulneren sus políticas. Con el fin de identificar los vídeos generados, cada fotograma incluye un marcador denominado SynthID (un identificador de imágenes o vídeos generados por IA desarrollado por Google DeepMind, y que no se ve a simple vista), de manera que pueda detectarse su origen sintético en caso de ser compartido en distintas plataformas.

Además, el modelo evalúa los textos que reciben como entrada, aunque reconoce que el contenido final depende en gran medida de las indicaciones proporcionadas por el usuario. Google invita a enviar opiniones mediante la herramienta de retroalimentación incluida en las aplicaciones, con el propósito de perfeccionar la moderación y corregir posibles desviaciones en la generación de contenidos.

Quienes deseen explorar estas nuevas funcionalidades pueden acceder a Gemini y Whisk desde aplicaciones web o dispositivos móviles. Con ello, Google impulsa la creatividad de la inteligencia artificial y amplía las posibilidades para la elaboración de vídeos breves en distintas áreas.