La inteligencia artificial ha demostrado ser una de las tecnologías más disruptivas de nuestro tiempo y su impacto afecta a numerosos ámbitos de nuestra vida, incluido, claro está, el de la creación artística. Muchos autores enfrentan ahora mismo dudas que afectan a sus procesos artísticos y su papel como creadores. Hasta cierto punto podría pensarse que el funcionamiento de los derechos de autor, tal y como hasta ahora los conocemos, está en cuestión.

La inteligencia artificial nos obliga a replantear el concepto clásico de autoría donde el autor era visto como el “hacedor” completo de una obra, tanto material como intelectualmente. Incluso, desde un punto de vista filosófico, nos lleva a redefinir la percepción que socialmente tenemos sobre la autoría y la creatividad, porque la incorporación de una tecnología tan impredecible y sorprendente en los procesos creativos nos plantea dudas sobre la intervención (cualitativa y cuantitativa) de dicho autor en el resultado final. ¿Debemos pensar que la obra es atribuible a la IA? ¿En qué medida los comandos, las órdenes y las elecciones de un autor determinan el resultado obtenido como output? ¿Podemos seguir viendo a los autores como creadores que abordan un proceso intelectual y material en su totalidad? ¿Qué papel juega aquí entonces la inteligencia artificial?

La historia del arte ha demostrado que la incorporación de recursos tecnológicos e innovaciones técnicas en los procesos de creación artística es muy antigua. Los autores han sentido siempre inquietud y curiosidad por lo que el futuro y la contemporaneidad podía ofrecer. El cambio de década ha coincidido con una de las mayores revoluciones digitales y tecnológicas de la historia, acompañada al mismo tiempo de una alteración de nuestros patrones de consumo como consecuencia de la pandemia mundial que vivimos con la COVID-19. Entre esas innovaciones tecnológicas (podemos mencionar, entre otras, blockchain y las obras certificadas como NFT), sin duda, la inteligencia artificial es la que mayor impacto está teniendo y es en el campo de la creación artística donde su integración parece generar más dudas.

Actualmente hay varias situaciones controvertidas y casos abiertos por autores que reclaman la vulneración de sus derechos de propiedad intelectual a consecuencia del funcionamiento de estas herramientas de inteligencia artificial y piden a las grandes tecnológicas la adopción de medidas correctivas, indemnizatorias y de reconocimiento. Las cuestiones que surgen en torno a esta conexión entre IA y arte son de diversa índole y se presentan en distintos momentos dentro del ciclo de funcionamiento de estas herramientas.

Para ganar claridad en la exposición, voy a dividir los grandes problemas que se están planteando actualmente en tres grupos, que coinciden precisamente con el modo en el que estas inteligencias artificiales funcionan: los inputs, los prompts y los outputs.

 

DATA SETS, INPUTS, PLAGIOS Y REPRODUCCIONES NO AUTORIZADAS

Por una parte están los  la construcción de los data sets (inputs), es decir las grandes bases de datos, de información, de textos, de obras literarias, de música, de composiciones, de imágenes, de obras audiovisuales, etc., a los que las inteligencias artificiales acceden para poder entrenar sus mecanismos de machine learning.

Varios desarrolladores tecnológicos han admitido que el actual grado de desarrollo de las inteligencias artificiales y sus procesos internos de aprendizaje no habrían sido posibles sin el acceso masivo a obras que están protegidas por derechos de propiedad intelectual.1

Claramente la altísima calidad de los resultados obtenidos y el cada vez mayor perfeccionamiento de los outputs que estas herramientas arrojan no sería posible sin un proceso de aprendizaje y entrenamiento basado en obras, piezas, textos y un sinfín de contenidos, incluidos datos e información, de los que se han servido las inteligencias artificiales. Por este motivo, una de las reclamaciones más recurrentes sobre la que hay varios procesos abiertos actualmente en Estados Unidos2 se refiere a los autores que alegan que las inteligencias artificiales han utilizado sus obras de manera masiva sin consentimiento, sin licencia o sin autorización, por lo que los resultados arrojados por estas herramientas constituyen un plagio, una reproducción y una transformación no autorizadas de dichas obras, y sin que los autores hayan recibido por ello una justa remuneración.

Entender cómo funciona una inteligencia artificial por dentro supone anticipar que jurídicamente estos casos son muy difíciles de defender. Probar ante un tribunal una reclamación de plagio supone comparar dos obras: una original y otra sustancialmente parecida a la original de modo que no quepa duda alguna de que existe una copia no autorizada basada en una obra preexistente. Al tratar de demostrar ese supuesto plagio o transformación no consentida, vemos la dificultad que surge de probar que el output arrojado por una inteligencia artificial es un plagio de una obra original. En este marco debemos tener en cuenta que la propiedad intelectual no ampara estilos, ni estéticas. Un plagio, en cambio, sería mucho más que simplemente una obra ‘al estilo’ de un autor determinado. Todavía debemos ver cómo van a evolucionar estos casos abiertos, pero por el momento, parece que los tribunales se inclinarán a favor del funcionamiento de la inteligencia artificial.

sarah-anderser-inteligencia-artificial-derechos-autor

Comparativa entre la obra de la ilustradora Sarah Andersen y un output obtenido a través de Midjourney. Sarah, junto con otros autores, ha demandado a Midjourney por plagio.

 

EMPECEMOS POR EL PRINCIPIO: ¿DE DÓNDE VIENEN LOS DATOS?

En la construcción de los datasets, el uso de web scraping o de data mining es una técnica imprescindible para tener acceso a la enorme base de datos que utilizan las inteligencias artificiales en sus procesos de aprendizaje. No hay duda de que entre los datos, textos, imágenes y contenidos utilizados hay materiales protegidos por derechos de autor. La cuestión es si dicho acceso a los contenidos y su aprovechamiento para los fines de entrenamiento y aprendizaje es lícito y cuenta con un marco legal que lo ampare.

La Directiva (UE) 2019/790 sobre derechos de autor y derechos afines en el mercado único digital contempla expresamente el uso del web scraping como una excepción que autoriza el acceso a contenidos protegidos por propiedad intelectual bajo dos condiciones esenciales: la primera se refiere a la finalidad con la que se accede a dichos datos, que debe realizarse en el marco de una labor de investigación con fines científico-académicos; la segunda se refiere al hecho de que los autores no hayan excluido expresamente sus obras de estos procesos de rastreo en la web. En caso de que los creadores hubieran hecho un exclusión de sus trabajos, el acceso a ellos con el propósito de analizar y procesar de manera masiva esos contenidos exigiría obtener una autorización expresa por parte del titular de los derechos sobre las obras. Se añade un último requisito, y es que los rastreadores de contenidos hayan tenido acceso a estos materiales de manera lícita, lo cual se entiende que se produce cuando estos materiales están accesibles de manera pública en una página web sin ningún tipo de bloqueo o ejercicio de un op-out en su configuración que impida la labor de scraping.

El actual texto de la propuesta de Reglamento sobre inteligencia artificial en la Unión Europea se expresa en un sentido muy similar respecto a la labor minado de datos que las herramientas de inteligencia artificial deban realizar en sus procesos de aprendizaje y entrenamiento al acceder a contenidos protegidos por derechos de autor. Este reglamento, de hecho, dice que ha de ser plenamente compatible con las disposiciones de la Directiva 2019/790, lo que en definitiva significa que la excepción para autorizar el data mining y el web scraping previstos en dicha Directiva seguirán operando en este punto con las condiciones ya indicadas.

Debemos señalar que muchos desarrolladores de plataformas de inteligencia artificial de uso abierto han configurado versiones de suscripción premium en las que los usuarios pueden excluir sus contenidos de los procesos de aprendizaje de la herramienta. Fuera de estos supuestos, para los usuarios generales en abierto, las condiciones y términos de usos de estas plataformas establecen que cualquier información, dato, comando o material que se inserte en la plataforma a modo de prompt, con o sin imágenes, son inputs que las inteligencias artificiales siguen incorporando a sus bases de datos para continuar los procesos de aprendizaje, e incluso para adaptarse mejor a las necesidades, demandas u orientaciones del propio usuario.

En Estados Unidos, que es donde más casos hay abiertos por parte de autores en defensa de sus obras, no existe una previsión normativa semejante a la europea; pero el funcionamiento de los derechos de autor en la tradición jurídica anglosajona llega a resultados muy similares a través de distintas corrientes doctrinales, donde la más extendida es la del fair use. Conforme a esta doctrina, un aprovechamiento de materiales protegidos por derechos de autor cuya finalidad sea transformar, comentar o analizar una obra preexistente, sin que se genere confusión entre ambas obras en el destinatario final y sin que se provoque un perjuicio directo en el autor de la obra original, podría considerarse legítimo aunque no se contase con la autorización expresa de los autores cuyas obras están empleando de base. Este fue el principal argumento que se utilizó en el célebre acaso contra Google de 2015, cuando Google lanzó Google Books, en donde los repositorios ofrecidos por el buscador aportaban al mismo tiempo un breve extracto de la obra original. El gremio de escritores en Estados Unidos demandó a la tecnológica alegando que se realizaba una reproducción no autorizada de sus obras, con el perjuicio evidente que esto podría suponerles y la disminución de las ventas en potenciales lectores. No obstante, los tribunales consideraron que la actuación de Google estaba amparada por la doctrina de fair use porque, en definitiva, los extractos ofrecidos por el buscador suponían una reproducción de fragmentos muy breves de la obra original (uso inocuo) y, en última instancia, esto podía incluso beneficiar a los autores al incentivar el interés por la obra original. Muy probablemente los casos ahora abiertos en Estados Unidos se canalicen por esta vía dada la dificultad que existe para probar algunas de las alegaciones presentadas por los creadores como el plagio que ya hemos mencionado. Y esta es la línea de defensa a la que se acojen las grandes tecnológicas que están detrás de las IAs.

Nightshade demo display, by Ben Y. Zhao, via artnews.com

 

Con todo, los creadores están muy preocupados por el aprovechamiento ilegítimo y el uso indiscriminado de sus obras que las grandes corporaciones realizan para entrenar los modelos de inteligencia artificial que luego comercializan. La posibilidad de excluir contenidos específicos a través de cuentas de suscripción premium es relativamente reciente y parece responder a la demanda de los autores que quieren dejar sus obras al margen de estos procesos. Esta configuración se adapta a las previsiones normativas europeas. Recordemos también que la última versión de DALL·E, lanzada en octubre de 2023, está programada para que sus outputs no puedan reproducir el estilo de artistas vivos. Asimismo, se buscan soluciones tecnológicas adicionales como la creación de softwares o mecanismos tecnológicos que impidan el aprovechamiento de contenidos por parte de las inteligencias artificiales. Podemos citar como ejemplo la iniciativa nightshade (sucesora de Glaze) elaborada desde la Universidad de Chicago que permite la integración un filtro a los archivos de obras digitales cuyo efecto es impedir progresivamente la correcta identificación de imágenes por parte de las inteligencias artificiales. Como resultado, la generación de outputs no se corresponden con la terminología empleada por los usuarios y resulta errónea o equivocada. Estas medidas se añaden a otras prácticas que se empiezan a estandarizar, como la inserción de cláusulas de exclusión de contenidos para fines de entrenamiento que se introducen en los contratos de edición (musical, literaria) o la configuración de robots.txt para evitar que las arañas de rastreo accedan a los contenidos de nuestras webs.

Seguiremos hablando de los prompts y los outputs en el siguiente post.

______________

Imagen portada: Boris Eldagsen, “The Electrician”, obra creada con IA y ganadora del Sony World Photography Awards en 2023 (el autor rechazó el premio).

______________
Notas

1 The Register: “OpenAI: ‘Impossible to train today’s leading AI models without using copyrighted materials’”. Disponible en: https://www.theregister.com/2024/01/08/midjourney_openai_copyright/ Volver a nota 1

2 Entre otros: New York Times Company v. Microsoft Corp. and OpenAI (dic. 2023); Sancton v. OpenAI Inc., Microsoft Corporation, et al. (nov. 2023); Authors Guild, et al. v. OpenAI (sept. 2023); Chabon v. OpenAI (sept. 2023); Silverman, et al. v. OpenAI (julio 2023); Tremblay v. OpenAI (junio 2023); Getty Images (US) v. Stability AI (feb. 2023). Volver a nota 2

 

Marta Suarez Mansilla. Gestora Cultural y Abogada Jurídica en Derecho del Arte. Foto: Berta Delgado. YANMAG

Autor: Marta Suárez-Mansilla

Abogada especializada en derecho del arte, nuevas tecnologías y cultura. Con amplia experiencia en el sector del arte contemporáneo y en la gestión de proyectos, mi trabajo se centra ahora en la consultoría de alta especialización para proyectos culturales y el tratamiento de las cuestiones jurídicas que rodean este campo de actividad.

© Marta Suárez-Mansilla
ISSN 2530-397X
ArtWorldLaw Bulletin. Crónicas de Temis y Atenea. nº 10 MADRID. Febrero 2024.