RSL ¿un estándar que nace abortado?

La nula presencia de compañías del sector de la IA apoyando a este nuevo estándar me hace dudar, y mucho, de la viabilidad de su implantación.
23 de septiembre, 2025
Guillem Alsina

La semana pasada hablaba, yo mismo y como noticia, de la presentación de RSL, un nuevo estándar de licenciamiento de contenidos online con el que la industria editorial espera monetizar su participación involuntaria en el entrenamiento de los modelos de lenguaje de las grandes ‘majors’ de la inteligencia artificial, como OpenAI, Google o Antrophic.

Como ya expliqué en la noticia sobre esta presentación, los nombres vinculados al nuevo estándar son, por ahora, y exclusivamente, todos del sector de los contenidos y, para sorpresa de nadie, ninguno del campo de los creadores de modelos de lenguaje, incluso en la semana posterior a su presentación.

El planteamiento realizado del estándar es bastante bueno, con el uso de una tecnología existente como es la de robots.txt para gestionar los derechos; abierto y, por lo tanto, transparente; y que responde al interés de las editoras de contenidos de poder monetizar sus contenidos de una forma fácil.

El problema es que no responde a los intereses de las empresas del sector de la IA, que preferirían utilizar todos los contenidos posibles sin tener que pagar un sólo royaltie y, de ahí, que lo más probable es que estén ignorando a drede la presentación de este nuevo estándar que, no obstante, les facilitaría la vida en gran medida en el caso de abrazarlo.

Recientemente, asistí a un evento en el que el ponente (y me abstengo de dar más datos por aquí por si acaso) explicaba que las empresas de IA acostumbran a hacer scrapping sin contemplaciones de todos los contenidos que encuentran en Internet.

Desde la industria de la IA se ha aducido alguna vez que, si tuvieran que pagar por todos los contenidos que utilizan para entrenar sus modelos de lenguaje, no les salirían las cuentas. Pero ¿seguro que no los podrían entrenar a base de contenidos que carezcan de derechos de copyright? Por ejemplo, obras clásicas o libros liberados bajo licencias libres, al igual que toda la suerte de contenidos bajo licencias libres disponibles en la red.

A buen seguro que desde las empresas de IA aducirán que cuanta más información puedan utilizar, más completo será el entrenamiento de sus modelos de lenguaje y, por lo tanto, más útiles serán, y que las consecuencias de no maximizar su potencial será una menor utilidad para las empresas y, por lo tanto, un menor progreso, cosa que si bien es cierta, no justifica ningún saqueo.

También es cierto que, particularmente, soy favorable a que la IA pueda utilizar todo el contenido no protegido por copyright para su entrenamiento de forma libre. ¿Por qué? La respuesta, para mi, es simple: porque yo, y cualquier ser humano que haya recibido una educación, ha hecho lo mismo.

Es cierto que mis libros de texto escolares, del instituto, y de la universidad, con los que han y he forjado parte de mi educación, costaron un cierto dinero, pero el resto de mi formación también fue gracias a textos que leí de forma gratuita, y que han moldeado, ni que sea parcialmente, mi forma de escribir al aprender giros, modismos e, incluso, apropiarme de expresiones.

En este sentido ¿es lícito considerar a la IA de la misma forma que a una persona? En mi humilde opinión, sí y, además, si alguien argumenta que la IA es un recurso para que una empresa saque partido económico de ella, y que la empresa que la ha creado también gane un dinero, ¿qué no es un trabajador contratado mediante una ETT o una agencia de cazatalentos, sino un perfil que da dinero a la empresa que lo contrata gracias a su trabajo, así como a la que lo llevó a aquel trabajo?

La solución al problema del pago por uso de los contenidos no es tan simple como un sí o como un no, y requiere de un debate largo y tendido, teniendo en cuenta que, si lo hacemos bien, la IA puede significar el tener que cambiar la forma en como entendemos la relación de las personas con el trabajo.