Recientemente un Tribunal de los Estados Unidos profirió una interesante decisión (Bartz v. Anthropic PBC, 2025) que nos puede servir de provecho no solo por ser un caso importante del “copyright”, sino también para la inteligencia artificial en general.  El asunto trae causa de la demanda interpuesta por tres personas que demandaron a una empresa llamada “Anthropic”, compañía que desarrolla sistemas de información y modelos de lenguaje, fundada por ex miembros de Open IA, cuyo problema jurídico abordó el presunto uso ilegítimo de libros, ya sea comprados, o escaneados por parte de un ChatBots. Luego de un tiempo de disputa, el pasado 23 de junio el Tribunal falló a favor del “fair use” de las copias digitales para la creación de contenido, dictaminando un “uso justo” dando lugar a uso transformativo de reproducción.

El fin de capacitar a los modelo de lenguaje de gran tamaño como lo que hizo Anthropic es de uso legítimo, estos “modelos de lenguaje grande” se están utilizando para entrenar un aprendizaje aumentado, a la vez supervisado de información, del cual se le adjunta un cúmulo de textos, cuyo objetivo es el de trazar las tareas que sean necesarias para el desarrollo del lenguaje, en este caso jurídico. La automatización se debe a la retroalimentación que hacen a su vez sus programadores (RLHF), técnica que sirve para precisar las preferencias temporales de los usuarios, teniendo en cuenta sus intereses, por esto que se haya desestimado en la demanda el cargo del “uso justo” más no de la biblioteca permanente estimada en el segundo ya que generaba daño en la propiedad intelectual. 

Para comprender el caso jurídico de mejor manera, debemos tener en cuenta los cuatro (4) factores que fueron estudiados por el Tribunal, y estos son: 

i) Propósito y carácter del uso: Es decir, se analiza lo que era transformativo o no y si en verdad había un producto nuevo, diferente, inédito, aunque no haya pasado lo mismo con el cargo segundo de la decisión, que era el de crear copias permanentes en una biblioteca de la empresa por ser copyright.  

 

ii) Naturaleza de la obra utilizada: Se determina en este factor si en verdad eran propias, u originales de los autores, más no inventadas, en todo caso el uso del lenguaje de programación lo hizo transformativo. 

 

iii) Cantidad y sustancia del contenido, Este último factor tomó un gran peso en la decisión, al ser un poco menos favorable para la empresa, ya que la información almacenada si hizo necesaria para crear nueva información y 

 

iv) Efecto del uso sobre las personas: Se indica en este factor, del cual afecta el segundo cargo de la decisión, en el que se determina que no exista copias permanentes de los textos utilizados almacenados. 

 

Como vemos, los modelos de lenguaje de gran tamaño son necesarios en el uso justo de la información y de las ideas en la sociedad, y que por tanto la norma de derecho de autor lo permite (copyright act, véase, § 107 y, § 109, como la doctrina de la primera venta y la constitución estadounidense, artículo I, § 8, cláusula octava). El fin no es precisamente la comercialización, sino el progreso en el desarrollo del conocimiento, y la ciencia, y por tanto del aprendizaje (paideia). La ejecución del modelo al ser reproductivo, y transformativo, toma a partir del entrenamiento de la programación, la compresión no solo de la propiedad sino del ingreso de esa información al sistema, que resulta crucial para la generalidad. Para el caso mencionado, el lenguaje conocido como Claude para esta empresa tuvo ahora mayores capacidades mejoradas en distintas áreas, como el que integra el razonamiento abstracto como sucedería en otros lenguajes, piénsese en el Asistente Legal llamado, Ariel  

A pesar de que la empresa ha sido inyectada con recursos provenientes de Amazon, e incluso del mismo Google, quienes se pueden considerar como sus competidores, resulta prominente, y hasta controversial, puesto que el inicio de la disputa comienza porque la compañía ideó obtener “todos los libros existentes”. Por ello contrataron a un exempleado de Google Docs, capacitando así a su lenguaje informativo con el escaneo de libros. En contraste, con el segundo cargo, sí que resultaría ilegal el descargar miles o millones de libros piratas como sucede con páginas piratas, más no en su compra física o escaneada, ya que para usarlos el lenguaje de programación no tiene ninguna repercusión jurídica en cuanto a una violación de propiedad intelectual por lo que se moldea como una transformación la información.

Sin duda alguna, este precedente judicial norteamericano sirve de derrotero a los distintos corporaciones judiciales, que están al avance de esta materia, sobre todo en cuanto a la disyuntiva del “uso justo”, cuando la finalidad es totalmente académica, investigativa, en todo caso del conocimiento, del saber. La cuestión se centra en que plataformas como Library Genesis, Z-library, Private Library pretenda duplicar fácilmente su “database”, y ahí es donde entra en juego la ilegalidad de la piratería que resulta interminable en cuanto a la información incluida, traducida como Biblioteca de Sombras (Shadow Library). Ahora, puede que el fallo emerja una paradoja, porque restringe guardar libros piratas en forma de Biblioteca, pero sí permite utilizarlos (aunque no sepamos) para textos obtenidos legalmente en propósito de entrenar a la Inteligencia artificial, y luego ser borrados, conforme a las normas de derecho de autor que crean esa “información transformativa”.

Si entramos a la website de Antrophic nos describe como eslogan lo siguiente: “Construimos IA para servir al bienestar a largo plazo de la humanidad”, ahora, puede que la disputa continúe, con otras compañías, y esto sabemos ya que este mismo mes, Reddit ha depositado una nueva demanda en contra de esta empresa alegando que estaba extrayendo datos de su página en violación de su acuerdo de usuario. Para nuestro caso colombiano no es fácil ni uniforme el tema, aunque ha habido pronunciamientos como la Sentencia T-323 de 2024 y proyectos de ley archivados que no une la materia que sustenta, de forma dura (hard law), a pesar de que en Sentencia SC 370-2023, la Corte Suprema de Justicia, ya haya reconocido, el “derecho humano al acceso y disfrute de los avances tecnológicos”, teniendo en cuenta el derecho constitucional, convencional y por tanto internacional, en todo caso debemos tener claro que la inteligencia artificial y su uso no puede ser un reemplazo total al operador jurídico sino un apoyo a su labor. 

En suma, el uso transformativo de modelos de lenguaje (LLMs) resulta interesante, en cuanto a que requieren como sucede con los seres humanos, un “entrenamiento” basada en una disciplina sana (fair use), que podemos llamar de uso justo, legítimo, de generación de contenidos, e información, transformativa, ex novo, del cual moldea a la sociedad en el aprendizaje (paidea) y esta capacitación no debe ser entendida como suplantación, sino una creación de mejora en los ChatBots en beneficio de la sociedad en general.  

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *