Google ha utilizado su conferencia anual para desarrolladores, celebrada este pasado miércoles, para escenificar lo que define como su entrada de lleno en la era de los agentes, basándose en sus modelos de lenguaje de la familia Gemini. La compañía explica que su inteligencia artificial deja de limitarse a responder preguntas para pasar a ejecutar tareas en nombre del usuario, un cambio de paradigma que afecta tanto a sus productos de consumo como a su oferta para empresas y desarrolladores.
Como medida del recorrido alcanzado, la firma ha aportado cifras de uso de sus principales plataformas. El Modo IA dentro de Search ha rebasado los mil millones de usuarios activos mensuales, con un volumen de consultas que se duplica cada trimestre. Por su parte, la aplicación independiente de Gemini supera los 900 millones de usuarios mensuales, mientras que más de 8,5 millones de desarrolladores trabajan cada mes con los modelos de la compañía para construir nuevas aplicaciones y experiencias.
En materia de modelos fundacionales, Google ha presentado Gemini 3.5 Flash, el cual combina capacidades avanzadas con una velocidad de ejecución cuatro veces superior a la de propuestas equivalentes, según afirman desde la compañía. Junto a este, ha mostrado Gemini Omni, un modelo concebido para generar cualquier tipo de salida a partir de cualquier tipo de entrada, comenzando por el vídeo. En el terreno del desarrollo, la firma ha actualizado su plataforma Google Antigravity hasta la versión 2.0, ahora disponible como aplicación de escritorio independiente para que los programadores puedan diseñar y coordinar agentes autónomos.
La oferta dirigida al tejido empresarial se canaliza a través de Gemini Enterprise Agent Platform, una propuesta destinada a los clientes de Google Cloud que se apoya en Gemini 3.5 Flash y en una nueva API de agentes. Su planteamiento permite a los equipos de desarrollo construir y desplegar agentes a medida dentro de un entorno controlado, una pieza que apunta directamente al interés de los responsables de tecnología en las organizaciones por integrar este tipo de automatizaciones en sus procesos corporativos.
En el ámbito del consumidor, las novedades alcanzan a varios productos del ecosistema de Google; YouTube incorpora Ask YouTube, que reorganiza la respuesta a las preguntas del usuario agrupando vídeos largos y formato Shorts en piezas estructuradas e interactivas con saltos directos a los fragmentos relevantes. Workspace estrena Gmail Live, Keep y Docs Live, funciones de voz para redactar y modificar documentos hablando, así como Google Pics, una herramienta de creación y edición de imágenes apoyada en el modelo Nano Banana que permite mover, redimensionar o sustituir elementos concretos dentro de una composición. La compañía también ha avanzado que durante el próximo otoño pondrá a la venta unas gafas de audio con Gemini integrado, pensadas para ofrecer asistencia por voz sin necesidad de mirar la pantalla del teléfono.
Uno de los anuncios con mayor proyección comercial es el del Carrito Universal, una función integrada en la Búsqueda y en la aplicación Gemini que automatiza el proceso de compra en línea. Esta nueva herramienta busca ofertas, avisa al usuario de bajadas de precio, y comprueba la compatibilidad entre productos, apoyándose en el Protocolo de Comercio Universal, conocido por sus siglas en inglés como UCP, que habilita el pago con un solo toque en marcas como Nike o Walmart, y cuya expansión está prevista hacia mercados como Canadá y hacia sectores como las reservas hoteleras.
De manera complementaria, Google ha presentado el Protocolo de Comercio Agéntico, denominado AP2, y que faculta a los agentes de inteligencia artificial para realizar compras en nombre del usuario respetando un presupuesto máximo fijado de antemano y dentro de un marco descrito por la compañía como seguro y privado.
El catálogo de agentes orientados al consumidor se completa con Gemini Spark, planteado como un asistente personal disponible de manera permanente; Daily Brief, que entrega cada mañana un resumen con acciones recomendadas; y la incorporación al buscador de agentes de información contextual junto a una interfaz generativa personalizada y al mencionado carrito inteligente.
Junto al despliegue de estas nuevas capacidades, la compañía de Mountain View ha situado la generación de confianza como una de sus prioridades en esta etapa. Para reforzarla, llevará la verificación de contenidos mediante SynthID y el estándar C2PA a Search, Chrome y la aplicación de Gemini, de manera que el usuario pueda contrastar la procedencia de lo que consume en la red. En paralelo, desplegará CodeMender, el agente desarrollado por DeepMind, para reforzar la seguridad de sus propias plataformas, y abrirá Gemini for Science con la intención de poner a disposición de la comunidad investigadora un conjunto de herramientas basadas en inteligencia artificial.



