Google presenta nuevos modelos de IA para generación de imágenes y vídeo

Veo e Imagen 3 de Google DeepMind llegan a Vertex AI ofreciendo a las empresas nuevas herramientas para generar y personalizar contenidos audiovisuales con alta calidad y realismo.
5 de diciembre, 2024
Google presenta nuevos modelos de IA para generación de imágenes y vídeo
Google presenta nuevos modelos de IA para generación de imágenes y vídeo

Google anuncia la ampliación de su oferta de inteligencia artificial con los modelos Veo e Imagen 3 desarrollados por DeepMind (subsidiaria de la firma del buscador), que estarán disponibles para los clientes de Google Cloud a través de Vertex AI.

Veo es, según Google, el modelo de generación de vídeo más avanzado hasta la fecha, que permite a las empresas generar vídeos de alta calidad a partir de indicaciones de texto sencillas o una imagen.

Por su parte, Imagen 3 consiste en un modelo de generación de imágenes que, según la compañía estadounidense, es su modelo que ofrece mayor realismo y calidad hasta la fecha, superando a sus modelos precedentes en cuanto a detalles, iluminación y reducción de artefactos.

Veo: generación de vídeo avanzada

Disponible en versión preliminar privada en Vertex AI, según Google convierte a esta empresa en el primer hiperescalador que ofrece a sus clientes un modelo de generación de vídeo a partir de imágenes.

Esta tecnología abre nuevas posibilidades de expresión creativa y simplifica los flujos de trabajo de producción de vídeo. Veo ofrece un amplio espectro de estilos cinematográficos y visuales, y funciona a una velocidad notable.

Gracias a su comprensión avanzada del lenguaje natural y la semántica visual, puede generar vídeos muy fieles a las indicaciones proporcionadas, creando secuencias coherentes en las que personas, animales y objetos se mueven con gran realismo.

Imagen 3: imágenes de mayor realismo y calidad

Disponible para todos los clientes de Vertex AI a partir de la próxima semana. Es el modelo de generación de imágenes de mayor calidad de Google, generando imágenes con un grado aún mayor de realismo y calidad, superior a todos los modelos anteriores en cuanto a detalle, iluminación y reducción de artefactos, afirman desde la misma empresa.

Esta herramienta permite a las empresas crear fácilmente logotipos e imágenes de alta calidad que reflejen el estilo de su marca, para fines de marketing, publicidad o diseño de productos.

Además, Vertex AI proporciona una plataforma de orquestación que simplifica la personalización, la evaluación del rendimiento y la implementación de estos modelos dentro de la infraestructura de Google.

Seguridad y responsabilidad en la IA

El desarrollo y despliegue de Veo e Imagen 3 se ha llevado a cabo conforme a los principios de IA de Google, buscando la seguridad y la responsabilidad. Se han incorporado precauciones como marcas de agua digitales, filtros de seguridad y funciones de gobernanza de datos.

SynthID de Google DeepMind inserta marcas de agua invisibles en cada imagen y fotograma producido con Imagen 3 y Veo, para mitigar problemas asociados con la desinformación y la atribución engañosa. Tanto Veo como Imagen 3 tienen salvaguardias integradas que aportan protección frente a la creación de contenidos perjudiciales, y cumplen con los principios de Google para una IA responsable.

La empresa planea seguir invirtiendo en nuevas tecnologías para mejorar la seguridad y la protección de la privacidad de sus modelos.

De acuerdo con los controles de privacidad y gobernanza de datos integrados en Google Cloud, no se utilizan datos de clientes para entrenar los modelos; los datos del cliente solo se procesan según sus instrucciones. El descargo de responsabilidad asociado al uso de servicios de IA generativa ofrece tranquilidad a los usuarios, ya que Google es líder en todo lo que afecta al respeto de los derechos de autor.

Nuevas funciones para personalización de imágenes

Adicionalmente, se están poniendo a disposición general de los clientes incluidos en la lista de entidades permitidas (se puede solicitar su adhesión aquí), nuevas funciones pensadas para ayudar a las empresas a editar y personalizar imágenes a la medida de sus necesidades de negocio.

Imagen 3 Edition ofrece herramientas potentes y sencillas para retocar y adaptar cualquier imagen. Permite editar fotos con una simple indicación de texto, editar sólo determinadas partes de una imagen (edición basada en máscaras), cambiar el fondo de una imagen de producto o modificar la escala de una imagen para adaptarla a los requisitos de tamaño.

Con Imagen 3 Customization se puede guiar al modelo para que genere imágenes con las características deseadas, con un alto grado de control. Facilita la generación de nuevas imágenes que reflejen la marca, estilo, logo o las temáticas y características de producto que se deseen. Todo ello abre nuevas posibilidades creativas, con un desarrollo acelerado y mucho más potente de activos publicitarios y de marketing.