Los chatbots multiplican la captura de información sensible de los usuarios

Un análisis revela que las apps de IA conversacional recopilan cada vez más datos sensibles (incluyendo ubicación, salud y biometría), aumentando los riesgos de uso publicitario o analítico.
1 de abril, 2026
Digital Inside_chatgpt_IA

Para comprender el alcance de la recopilación de información por parte de las inteligencias artificiales, los investigadores de Surfshark basaron su metodología en el análisis de las diez aplicaciones conversacionales con mayor cuota de mercado dentro de la tienda oficial de Apple. El estudio evaluó los tipos de datos requeridos, su vinculación con la identidad del individuo y la presencia de anunciantes externos. Contrastando además esta información con las políticas de privacidad de los desarrolladores para determinar los periodos de retención en sus servidores. Los resultados dictaminan que todas las herramientas estudiadas registran datos de sus usuarios, con una media de catorce tipos de información recopilada sobre un máximo de 35 parámetros posibles. El cambio interanual más evidente se observa en el seguimiento geográfico, ya que actualmente el 70% de estos asistentes registra la ubicación del usuario, frente al 40% del año anterior.

Tomas Stamulis, directivo de seguridad de la firma responsable del análisis, advierte que: «Los chatbots se están volviendo cada vez más agresivos con los datos de los usuarios. Nuestra investigación muestra que el 70 % de las apps populares de IA ahora recopilan datos de ubicación, un fuerte aumento en comparación a solo el 40 % del año pasado. Este aumento en la necesidad de datos también es evidente en plataformas como ChatGPT, que recientemente incrementó su recopilación en un 70% para incluir todo, desde métricas de salud y estado físico hasta historial de búsqueda y datos de audio.

A diferencia de los motores de búsqueda tradicionales, estos bots ahora manejan cargas altamente sensibles como documentos de impuestos y registros médicos, que pueden compartirse a través de redes masivas de terceros para anuncios dirigidos. Para proteger tu privacidad, debes tratar cada instrucción como un registro público: audita tu configuración, deshabilita el historial de chat y nunca compartas lo que no te gustaría que se supiese públicamente«. Ante este escenario, los especialistas recomiendan tratar cada interacción como un registro público, revisando la configuración de privacidad y desactivando el historial para evitar compartir información que no deba trascender.

Al diseccionar el comportamiento de cada herramienta, Meta AI encabeza la captura de información al registrar 33 de los 35 parámetros posibles. Lo que supone prácticamente el 95% del total, siendo la única plataforma que archiva datos financieros. Tanto esta aplicación como Google Gemini capturan información de carácter muy íntimo, incluyendo el origen racial o étnico, la orientación sexual, detalles sobre embarazos o partos, discapacidades, convicciones religiosas o filosóficas, afiliación sindical, inclinación política y parámetros genéticos o biométricos. En el caso específico de Google Gemini, el sistema recopila 23 tipos de información, sumando a lo anterior historiales de navegación y búsqueda, la ubicación exacta, el contenido generado por la persona y la lista de contactos de su dispositivo, un volumen que los expertos consideran altamente intrusivo.

Por su parte, ChatGPT ha pasado de solicitar 10 tipos de datos a 17, incorporando información sobre salud, ubicación y grabaciones de audio. Representando un aumento del 70% en su apetito por los datos respecto al pasado ejercicio. Aunque 14 de estos parámetros se justifican para mantener la operatividad del sistema, los registros de salud, estado físico o publicidad no son necesarios para su funcionamiento. Esta información excedentaria se desvía hacia labores de analítica, personalización de productos, campañas de marketing de los propios creadores o anuncios de terceros.

En un escalón inferior por volumen se encuentra Claude, que demanda 13 tipos de datos. Esta información resulta vital para el mantenimiento de sus servidores, la autenticación, la prevención de fraudes y el soporte técnico. Aunque la empresa también destina parámetros como la ubicación aproximada o los archivos multimedia a usos de marketing y analítica.

Finalmente, con la misma cantidad de 13 parámetros recopilados se sitúa DeepSeek, que registra las entradas de texto y todo el registro de las conversaciones. Sobre esta plataforma, el responsable de seguridad del estudio subraya que los servidores de DeepSeek se ubican en China y la empresa retiene el historial de los chats sin estar sujeta al Reglamento General de Protección de Datos europeo o a las leyes federales estadounidenses que sí supervisan a competidores como OpenAI o Google. Esta carencia de un marco legal equiparable y la falta de supervisión regulatoria incrementan los riesgos sobre la protección real de la información volcada por los usuarios en el sistema.