Mientras las aguas del río de la IA vuelven a su cauce una vez superado el desbordamiento provocado por DeepSeek (el cual, por cierto, parece que ahora está en tela de juicio), OpenAI parece empeñada en hacernos olvidar el motivo por el cual hemos desviado la atención de ChatGPT a base de presentar novedades para su chatbot.
Si anteayer hablábamos del nuevo modelo o3-mini, y hace pocos días de Operator, el primer agente de la compañía, hoy toca hacerlo de Deep Research, un agente diseñado para llevar a cabo investigaciones en múltiples etapas a través de Internet. Esta herramienta es capaz de completar, en cuestión de minutos, tareas que normalmente exigirían a un profesional horas de trabajo.
El sistema opera de forma autónoma: el usuario solo debe introducir una consulta y el agente se encarga de buscar, analizar y sintetizar información de cientos de fuentes en línea, generando un informe detallado comparable al elaborado por un analista de investigación.
El desarrollo de Deep Research se sustenta en una versión del próximo modelo o3 de OpenAI, optimizado para la navegación web y el análisis de datos. Mediante el uso del razonamiento, la herramienta interpreta y examina grandes volúmenes de texto, imágenes y documentos en formato PDF, adaptándose a la información encontrada durante el proceso. Además, la capacidad para consolidar conocimientos se integra en el avance que conduce a la consecución de una AGI, lo cual se enmarca en los objetivos a largo plazo de la compañía.
Aplicaciones y metodología de Deep Research
Esta nueva funcionalidad se orienta a profesionales que desempeñan labores intensivas en sectores como las finanzas, la ciencia, la política y la ingeniería, así como a usuarios que requieren recomendaciones personalizadas en procesos de compra complejos. La herramienta genera salidas completamente documentadas, presentando citas precisas y un resumen del razonamiento que facilitan la verificación de la información y permiten el acceso a datos de carácter específico, los cuales habitualmente demandarían la consulta de numerosos sitios web.
Para alcanzar estas capacidades, Deep Research ha sido entrenado mediante tareas reales que implicaban el uso de herramientas de navegación y de Python, utilizando métodos de aprendizaje por refuerzo similares a los aplicados en el desarrollo del modelo o1 de OpenAI. Mientras dicho modelo demostró aptitudes en áreas como la programación y las matemáticas, la nueva herramienta expande estos recursos para abordar problemáticas que requieren un contexto amplio y la recopilación de información diversa en línea.
El uso de esta funcionalidad es sencillo a través de la interfaz de ChatGPT: el usuario selecciona la opción correspondiente, introduce la consulta y, de ser necesario, adjunta archivos u hojas de cálculo para aportar contexto adicional. Durante la ejecución, aparece una barra lateral que resume los pasos realizados y las fuentes consultadas, culminando en un informe integrado en el chat que, en próximas actualizaciones de Deep Research, también incorporará imágenes, visualizaciones de datos y otros recursos analíticos.
Evaluación, limitaciones y futuro despliegue
En pruebas de evaluación, el modelo que respalda Deep Research ha participado en la prueba denominada Humanity’s Last Exam, en la que alcanzó una precisión del 26,6% a lo largo de más de 3.000 preguntas abarcando diversas áreas de conocimiento. Los resultados evidenciaron mejoras notables en campos como la química, las humanidades, las ciencias sociales y las matemáticas, atribuyéndose al sistema una aproximación similar a la humana al buscar información especializada cuando la situación lo requirió.
No obstante, a pesar de las capacidades desplegadas, la herramienta presenta limitaciones propias de una tecnología en fase inicial. Se han detectado casos en los que se producen errores en la generación de datos o interpretaciones incorrectas, aunque estos se presentan a una tasa inferior a la de los modelos existentes. Asimismo, el sistema muestra dificultades para diferenciar información autoritativa de rumores y, en ocasiones, la calibración de la confianza no refleja con precisión el grado de incertidumbre. Se han indicado también pequeños errores en la presentación de informes y citas, y en algunos casos los tiempos de respuesta inicial pueden resultar superiores a los previstos.
En términos de acceso, OpenAI ha iniciado la implementación de Deep Research para los usuarios Pro (los que pagan 200 dólares mensuales), permitiendo hasta 100 consultas cada mes. Se prevé que en breve la funcionalidad se extienda a usuarios Plus, Teams y Enterprise, y que se amplíe su disponibilidad en territorios como el Reino Unido, Suiza y el Área Económica Europea.
Paralelamente, se trabajará en la optimización de la infraestructura técnica para ofrecer una versión más rápida y rentable, basada en un modelo de menor tamaño, sin comprometer la calidad de los resultados.
Actualmente, la herramienta se encuentra disponible en la versión web de ChatGPT y se espera su despliegue en aplicaciones móviles y de escritorio en el transcurso de este mismo mes. La evolución de Deep Research apunta a integrar sus capacidades de investigación asíncrona con funciones adicionales que permitan la ejecución de tareas complejas, conectándose en el futuro a fuentes de datos especializadas y combinándose con otros agentes capaces de actuar en entornos reales.