Las organizaciones médicas, ejemplo de como la IA puede convertir la información no estructurada en estructurada

Y, una vez estructurada, sacarle partido analizándola, también gracias a la IA. Un proceso en el cual no es necesario utilizar IA Generativa, entrando en juego otras tecnologías de inteligencia artificial no tan proclives a errores por alucinaciones.
3 de noviembre, 2025

La información estructurada es aquella que se puede representar de forma tabulada, en la que cada columna de nuestra tabla es un campo o propiedad, y la información almacenada en cada fila corresponde a un individuo.

Una buena muestra de información estructurada consiste en la clasificación de la liga de fútbol: cada fila contiene una serie de datos de cada equipo, como el número de partidos jugados, los goles marcados, los goles recibidos, los partidos ganados, los perdidos, y los puntos conseguidos, que se encuentran repartidos entre las distintas columnas.

Con dichos datos podemos sacar estadísticas con gran facilidad, ordenándolos por puntuación obtenida, para saber qué equipo ha sido el más goleador, el más goleado, u otros.

El problema es que no siempre tenemos todos los datos de una organización en este tipo de formato, puesto que, con los años, acumulamos mucha información desestructurada, por ejemplo, en forma de hojas con escritos, que cuesta resumir y tabular. Y es aquí donde puede entrar en juego la inteligencia artificial, que nos puede ayudar a convertir la documentación no estructurada en estructurada, tabularla para facilitar su análisis.

Un buen ejemplo del potencial de esta tecnología nos lo trae George Bosnjak, cofundador de la startup de IA Morph Services, quien, en Hea!thcare Innovation firma un artículo sobre cómo convertir la abundante documentación no estructurada del sector salud en información estructurada gracias a la IA para su posterior uso en análisis y para generar estadísticas, acciones que, en muchos casos, también pasarán por las manos de la inteligencia artificial.

Antecedentes

El campo de la salud es proclive a disponer de un gran volumen de información desestructurada, ya que médicos y enfermeras rellenan cuestionarios (incluso los informatizados con una cierta estructura) con información importante en campos de texto libres. Esta situación se hace especialmente evidente con los determinantes sociales de la salud (SDOH, por sus siglas en inglés), factores no médicos como el barrio en el que vive el paciente, su acceso a comida o transporte, el empleo o la estabilidad de la vivienda, con fuerte influencia en los resultados de su salud.

Aunque estos datos pueden estar presentes en la historia clínica electrónica, a menudo aparecen como texto libre no estructurado, disperso en informes de derivación, formularios de admisión o evaluaciones de trabajo social guardadas como anexos, lo cual supone una barrera estructural para una atención de calidad, porque la información existe pero es invisible para quien debe tomar decisiones.

Cuando un profesional de la salud no localiza, por ejemplo, una nota sobre inseguridad habitacional, esa señal no puede incorporarse a planes de cuidados, derivaciones a recursos o modelos de estratificación de riesgos. Se hace, pues, necesario convertir esta información de manera que podamos encuadrarla en algún campo de nuestras bases de datos, y la vía para hacerlo pasa por la tecnología y por automatizar el procedimiento, yendo a parar sin duda alguna al uso de inteligencia artificial.

Los últimos avances en materia de procesamiento del lenguaje natural (NLP), reconocimiento óptico de carácteres (OCR) y modelos de lenguaje (LLM) hacen posible escanear de forma rápida documentos no estructurados y convertirlos en datos normalizados que se integran en el historial electrónico del paciente, de manera que lo que antes exigía una revisión manual del historial, o bien equipos dedicados a introducir datos, hoy puede resolverse en segundos.

En la práctica, si una carta de derivación escaneada menciona que un paciente tiene dificultades de transporte, un sistema de IA puede extraer esa información, codificarla y resaltarla como riesgo SDOH relacionado con la movilidad.

Al derribar silos de datos y dar el paso de “dato atrapado” a “información clínica”, los centros sanitarios pueden construir una visión más completa de la persona, coordinando mejor entre trabajo social, atención primaria, especialistas y gestión de casos, reduciendo la carga administrativa al automatizar extracción y registro.

Este cambio ya se observa en organizaciones pioneras como Watershed Health, que reportan menos diagnósticos omitidos, mayor precisión en la estratificación del riesgo y una mejora en la satisfacción del paciente, según detalla Bosnjak.

Si a estas alturas, alguien tiene dudas sobre el uso de la IA por las alucinaciones que esta puede producir, cabe decir que dicho problema corresponde a la IA Generativa, y que las tecnologías de IA empleadas para convertir el texto desestructurado en datos estructurados son distintas a la Generativa.

Conclusiones

La argumentación de Bosnjak se circunscribe al ámbito de la salud, pero su principal conclusión se puede extrapolar a cualquier ámbito profesional; todas las organizaciones (incluídas las empresas) son susceptibles de poseer numerosa documentación, tanto de hace años como generada todavía actualmente, que no está estructurada, y que la IA puede convertir en información estructurada, analizándola y sacando conclusiones de ella.

Lo que hace falta es decidir qué información es la que se necesita analizar, cómo sale a cuenta hacerlo y, finalmente, qué sistemas implementar y con qué coste.