Convertir a los escépticos de la IA en defensores mediante datos de alta integridad

A pesar de que el 95% de las compañías farmacéuticas han iniciado proyectos de inteligencia artificial, la gran mayoría no logra superar la fase de piloto debido a una barrera crítica.
15 de abril, 2026

Durante años, las empresas farmacéuticas han acumulado grandes volúmenes de datos. Ahora, a medida que la industria avanza hacia un futuro impulsado por la IA, estos datos deben convertirse en un verdadero activo estratégico.

Según el informe The State of Data, Analytics, and AI in Commercial Biopharma de Veeva, aunque el 95% de las empresas farmacéuticas están impulsando activamente iniciativas de IA en marketing y ventas, casi ninguna (89%) logra escalar más de la mitad de sus pilotos. Esta falta de éxito suele deberse a una brecha de preparación. Este mismo estudio revela que el 67% de los líderes de la industria abandona proyectos de IA por la baja calidad de sus datos.

Los datos limpios y precisos son la base de cualquier iniciativa de IA: el 73% de los líderes afirma que la baja calidad de los datos es el principal obstáculo para escalar la IA. Sin embargo, la estrategia actual de gestión de datos en la mayoría de las empresas se basa en intentar armonizar adquisiciones de datos aisladas. Este enfoque no es sostenible, especialmente si el volumen de datos sigue creciendo. Los data scientist estiman que dedican hasta el 80% de su tiempo a preparar, limpiar y transformar datos para hacerlos utilizables.

Para que la IA pase de pilotos fallidos a generar valor empresarial, es necesario abordar el problema de la calidad de los datos. Esto requiere pasar de una gestión fragmentada de datos a una base de datos globalmente armonizada, con un enfoque proactivo del data stewardship.

La baja calidad de los datos sigue siendo la principal barrera para escalar la IA

La dependencia de datos defectuosos y fragmentados ha generado un creciente escepticismo: el 96% de los directivos afirma que sus datos no están preparados para la IA. Este impacto se observa claramente en el campo, con el 72% de las empresas planeando utilizar la IA para ayudar a los equipos resumiendo avances científicos de los HCPs para preparar visitas, a pesar de que la adopción sigue siendo limitada.

Los equipos de campo tienden a rechazar las recomendaciones de la IA porque no confían en la precisión de los datos en los que se basan. Cuando un modelo de “next-best-action” sugiere una acción basada en un cambio de afiliación de hace tres meses, el representante médico o MSL no solo ignora la recomendación, sino que pierde confianza en toda la plataforma. Muchos responsables de datos en empresas farmacéuticas se muestran reticentes a utilizar estos modelos debido a los problemas estructurales de confianza.

Erika Husing, business analyst, commercial operations en GSK, explica: “Si no confiamos en los datos, ¿cómo podemos extraer conclusiones a partir de ellos? Es muy importante que dejemos atrás el escepticismo y avancemos hacia una predisposición de confianza sobre ellos. Contar con datos de referencia de alta calidad es clave para que todo el equipo confíe en ellos.

El verdadero coste del data stewardship manual

Otro foco de consumo de recursos proviene de las innumerables horas que los equipos dedican a mapear manualmente especialidades locales y tipos de HCPs a estándares globales. Esto genera una enorme carga administrativa en cada nuevo mercado.

En una de las 20 mayores empresas farmacéuticas, los data scientist piden a los equipos de campo que revisen los datos de segmentación de clientes cada seis meses. Esta tarea desvía a estos equipos de su función principal, construir relaciones de confianza en el campo.

Quizá sea aún más frustrante que esta misma empresa estime que solo el 10% de sus datos están lo suficientemente limpios y bien gestionados  como para ser utilizados, y solo el 1% se utiliza en casos de uso relevantes. A medida que el volumen de datos sigue creciendo, las empresas farmacéuticas ya no pueden permitirse resolver los problemas de calidad de los datos a nivel local.

Una base de datos globalmente armonizada permite escalar la IA

La gestión de datos es inherentemente compleja, ya que las filiales locales mantienen los datos de forma diferente para cumplir con regulaciones regionales. El resultado de esto es un sistema fragmentado en el que los registros no son homogéneos entre países, lo que dificulta la analítica transversal y la aplicación de la IA.

Una base de datos globalmente armonizada garantiza que los datos sean consistentes y accesibles en todos los mercados. Antes de implementar un modelo global de datos, Bayer AG se enfrentaba a definiciones de datos inconsistentes y a la falta de una visión única del cliente entre mercados. “Nuestro entorno global de datos estaba fragmentado: cada país dependía de fuentes distintas,” explica Stefan Schmidt, digital capability lead en Bayer. “Para tener una visión completa, necesitábamos una base de datos de cliente unificada.

Para Bayer, contar con una base de datos centralizada y precisa no solo ha proporcionado una única fuente de datos fiables de HCPs y HCOs, sino que también ha aumentado la confianza en que la información de la IA es fiable. Esto hace que los equipos de campo cuestionen menos el sistema y sean más proclives a utilizar las recomendaciones de la IA.

Una base de datos globalmente armonizada proporciona la arquitectura necesaria para que los datos sean útiles en toda la organización, pero la verdadera eficiencia proviene de la propia fuente de datos. Al partir de una mejor base de datos, el foco pasa de corregir errores a mantener la excelencia de forma continua mediante una curación de datos con IA agéntica.

Mantener datos de alta integridad mediante curación de datos humana y agéntica

Durante décadas, la industria ha dependido del data stewardship manual para mantener la calidad de los datos. Hoy tenemos la oportunidad de elevar millones de registros a un nuevo nivel de calidad combinando la experiencia humana con la curación de datos mediante IA agéntica.

Los agentes de IA pueden asumir tareas específicas y repetitivas de curación de datos, como la verificación cruzada o la detección de duplicados. Estos agentes especializados revisan el 100% de los registros a diario y, posteriormente, un data steward humano valida los resultados.

Dado que los agentes funcionan de forma continuada, capturan los cambios en tiempo real, detectando señales incluso antes de que lleguen a los registros públicos. Por ejemplo, pueden identificar cambios en afiliaciones con un alto nivel de detalle. Esta precisión en tiempo real permite que la IA genere recomendaciones de “next-best-action” relevantes, basadas en datos actualizados. Además, evita el error común de que los equipos de campo reciban información sobre aspectos que ya conocen, como el traslado de una consulta que visitaron la semana anterior.

Al trasladar en gran medida la carga de la curación de datos a agentes autónomos, dejamos de depender de que los equipos de campo envíen actualizaciones y pasamos de un modelo reactivo, que a menudo genera escepticismo sobre los datos, a uno proactivo. La curación de datos mediante IA agéntica, combinada con el data stewardship humano, proporciona los datos verificados, fiables y de alta calidad necesarios para escalar la IA.

No se puede escalar aquello en lo que no se confía, ni confiar en aquello que no se ha armonizado. Una base de datos consistente a nivel global permite a las empresas farmacéuticas centrarse en utilizar los datos en lugar de invertir tiempo en limpiarlos. Este enfoque es el que convertirá a los mayores escépticos de la IA en firmes defensores.


Sebastian Wurst es director de OpenData Strategy en Veeva