Google ha dado a conocer una nueva iteración de su agente de investigación autónoma dentro del ecosistema Gemini, con el objetivo de dar el salto desde una herramienta orientada a la síntesis documental hacia una pieza integrable en procesos corporativos complejos. La firma de Mountain View ya había dado el primer paso este pasado mes de diciembre poniendo a disposición de los desarrolladores el agente Gemini Deep Research a través de la API Interactions, y ahora amplía dicha propuesta con dos configuraciones diferenciadas, Deep Research y Deep Research Max, ambas construidas sobre el modelo Gemini 3.1 Pro.
El planteamiento de Google es que el agente deje de comportarse como un motor de resumen avanzado y pase a funcionar como punto de partida para tareas de contexto previas a procesos automatizados más amplios, especialmente en sectores como las finanzas, las ciencias de la vida o los estudios de mercado. Con una única llamada a la API, los equipos de desarrollo pueden activar un flujo de investigación completo que combina información de la web con fuentes de datos propietarias y que devuelve análisis con citas de las fuentes.
La diferencia entre las dos modalidades radica en el equilibrio entre la velocidad y la profundidad; mientras que la versión estándar, Deep Research, sustituye a la publicada en preview en diciembre y está orientada a escenarios donde prima la baja latencia y la contención de costes, Deep Research Max ha sido concebido para procesos asíncronos que se ejecutan en segundo plano, con un mayor consumo de recursos de cómputo dedicados al razonamiento iterativo, lo que convierte a esta última opción en idónea, por ejemplo, para tareas programadas durante la noche para entregar informes a primera hora de la mañana.
Una de las novedades de mayor calado para el entorno profesional es la incorporación de compatibilidad con el protocolo Model Context Protocol (MCP), un estándar que permite conectar el agente con repositorios de datos externos y servicios especializados de una manera segura. Gracias a este soporte, el agente puede consultar la web, servidores MCP remotos, archivos subidos por el usuario y almacenes de ficheros conectados, o cualquier combinación de estas fuentes, lo que abre la puerta a explotar los universos de datos cerrados que manejan habitualmente los profesionales.
Desde Google señalan que la empresa trabaja con FactSet, S&P Global y PitchBook en el diseño de sus respectivos servidores MCP, de modo que los clientes compartidos puedan integrar sus suministros de datos financieros en flujos de trabajo impulsados por el agente.
Deep Research también incorpora, por primera vez dentro de la API de Gemini, la generación nativa de gráficos e infografías integrados en los informes mediante HTML o el sistema Nano Banana, con el fin de representar visualmente conjuntos de datos complejos sin necesidad de herramientas externas.
El sistema admite combinar simultáneamente búsquedas en Google, servidores MCP remotos, contexto de URL, ejecución de código y búsqueda en archivos, así como desactivar por completo el acceso a la web para limitar la investigación a fuentes internas. También acepta entradas multimodales en forma de PDF, CSV, imágenes, audio y vídeo, y ofrece transmisión a tiempo real de los pasos intermedios de razonamiento, con resúmenes de pensamiento en directo y salidas de texto e imagen a medida que se generan.
El usuario gana, además, margen de maniobra sobre el propio proceso de investigación, puesto que antes de que el agente empiece a ejecutar su tarea, es posible revisar, corregir y afinar el plan propuesto, lo que aporta un control granular sobre el alcance de la consulta.
En cuanto al rendimiento, Google sostiene que Deep Research Max consulta un número notablemente superior de fuentes frente a la versión anterior, y que detecta matices que la versión anterior pasaba por alto. La compañía afirma haber trabajado en enseñar al agente a ponderar evidencias contradictorias y a apoyarse en fuentes consideradas autorizadas, como los registros ante la SEC o las publicaciones revisadas por pares de acceso abierto, con el propósito de transformar datos técnicos densos en formatos listos para su uso por parte de los responsables de la toma de decisiones.
Deep Research y Deep Research Max se ofrecen desde hoy en preview pública a través de los planes de pago de la API de Gemini, con la documentación para desarrolladores publicada en el sitio oficial de Google AI. La compañía ha avanzado que ambos agentes llegarán próximamente a Google Cloud para su uso por parte de startups y empresas.



