RSL, un nuevo estándar para remunerar a los creadores de contenidos por usarlos en el entrenamiento de la IA

Basado en el estándar RSS, por el momento no cuenta con el respaldo de ninguna de las grandes empreses de la IA, lo que pone en entredicho su futuro.
15 de septiembre, 2025

El advenimiento de la IA ha provocado varios problemas a quienes publican en Internet como, por ejemplo, el descenso en las visitas a las webs que provoca el hecho que los internautas puedan obtener información directamente de la IA, a diferencia de lo que hacen con un motor de búsquedas como Google o Bing y, por otro lado, el uso de los contenidos que generan para entrenar las IAs, la mayoría de las veces sin remuneración de por medio.

Esto último ha llevado a diversos juicios, en los que grupos editoriales han acusado a las empresas de la IA de prácticas ilegales y abusivas por utilizar contenidos protegidos por copyright sin permiso y sin abonar las debidas tasas por su uso.

Precisamente para intentar solucionar dicho tema, y entre varias iniciativas distintas, la semana pasada veía la luz públicamente RSL (Really Simple Licensing), un sistema de licenciamiento de contenido online para permitir su empleo en el entrenamiento de modelos de lenguaje con la correspondiente remuneración, y la organización sin ánimo de lucro que lo gestionará, RSL Collective.

Cuenta desde el primer momento con el apoyo de una serie de nombres propios de gran peso dentro de la industria tecnológica y de los contenidos como son Reddit, Yahoo, People Inc., Internet Brands, Ziff Davis, Fastly, Quora, O’Reilly Media y Medium. La adhesión a este estándar es gratuita y no exclusiva, y la suma de participantes busca dar más capacidad de negociación para obtener reconocimiento y remuneración por el uso de los contenidos.

Este protocolo es abierto y descentralizado, se basa en el protocolo RSS, y puede aplicarse a páginas web, libros, vídeos y conjuntos de datos. RSS es un formato ampliamente adoptado para distribuir actualizaciones de contenido en páginas web, y RSL se apoya en esa base para escalar a millones de sitios y cubrir cualquier activo digital.

La propuesta se presenta como una nueva capa de infraestructura de licencias para una web en la que proliferan rastreadores y agentes de IA captando todo el contenido que pueden, a veces, sin pocos escrúpulos para utilizar trucos que les permitan recopilar los que teóricamente no podrían.

RSL añade a robots.txt términos de licencia y regalías legibles por parte de esos rastreadores y agentes, para que las aplicaciones de la IA compensen el uso de contenidos. El archivo robots.txt indica a los robots de indexación qué pueden o no rastrear, y RSL los utiliza yendo más allá del binomio sí permito/no permito, facilitando las herramientas para que los editores incorporen, en ese mismo punto de control, condiciones de uso y de pago que los agentes de IA deben respetar cuando utilizan el contenido para entrenar modelos o generar respuestas.

El estándar contempla modelos como gratuito, atribución, suscripción, pago por rastreo y pago por inferencia, y puede adoptarlo cualquier editor desde ya mismo. El pago por rastreo se refiere a compensaciones cada vez que una aplicación de IA accede a un sitio, mientras que el pago por inferencia a cada ocasión en la que el contenido de un editor se utiliza para producir una respuesta. Con ello, se habilitan esquemas de remuneración ajustados a distintos casos de uso.

Para contenidos no públicos o propietarios —como artículos bajo muro de pago, libros, vídeos o datos de entrenamiento— el protocolo prevé el cifrado de activos digitales, de forma que puedan licenciarse con seguridad. El estándar admite, además, el uso de servidores de licencias compatibles, incluyendo la propia RSL Collective u otros que implementen RSL.

Desde RSL Collective comparan su sistema de licenciar contenidos con el modelo de licencias colectivas de la música para fijar precios de mercado y reforzar la negociación entre editores y creadores. Su planteamiento es que, con una tecnología común, millones de editores y creadores sumen una oferta unificada ante las empresas de IA y de tecnología.

No obstante, esta propuesta nace con una seria deficiencia: ninguno de los nombres propios que la apoya proviene del mundo de la inteligencia artificial, solamente de la parte de los editores. Ni OpenAI, ni Google, ni Antrophic, ni ninguna otra de estas grandes compañías han dado su apoyo al estándard, y se desconoce si alguna podría suscribirlo más adelante.

Cuando estableces las reglas de un juego, necesitas que todas las partes las acaten, o no se podrá disputar ninguna partida. El futuro de RSL depende de ello.