Una nueva demanda por violación de derechos de autor ha sido presentada contra OpenAI y Meta. En este caso, por parte de la comediante y actriz Sarah Silverman, quien, junto a otros dos escritores, acusa a ambas compañías de utilizar ilícitamente libros de su autoría para entrenar a ChatGPT y LLaMA, respectivamente.
Los demandantes, Christopher Golden, Richard Kadrey y la citada Silverman, no solo acusan a las compañías de usar sin permiso su propiedad intelectual. También afirman que sus obras han sido obtenidas de forma ilegal, puesto que habrían sido extraídas de sitios web catalogados como "bibliotecas fantasmas".
Según recoge The Guardian, los autores han presentado distintas pruebas contra ChatGPT y LLaMA. En el caso del chatbot de OpenAI, Sarah Silverman remarcó que fue capaz de presentar un resumen de su libro The Bedwetter. En tanto que lo mismo ocurrió con Sandman Slim, de Kadrey, y Ararat, de Golden. Los tres mencionan que la plataforma no mencionó en ningún momento la información de copyright incluida en las publicaciones en cuestión.
En la demanda contra Meta, por su parte, remarcan que sus libros aparecen en los materiales utilizados para entrenar a LLaMA, su modelo de inteligencia artificial. El mismo se presentó en febrero pasado y poco después se filtró en la web, permitiendo el surgimiento de múltiples proyectos de código abierto de gran atractivo. Al igual que con ChatGPT, los autores sostienen que la obtención de su propiedad intelectual fue, básicamente, a través de la piratería en línea.
ChatGPT y Meta, en la mira por el supuesto uso indebido de materiales con copyright
Los casos de Sarah Silverman, Christopher Golden y Richard Kadrey no son los primeros en exponer las supuestas violaciones a los derechos de autor al entrenar a modelos de IA. La semana pasada, otros dos autores estadounidenses —Paul Tremblay y Mona Wad— presentaron una demanda contra OpenAI por el uso indebido de sus libros para entrenar a ChatGPT.
Pero eso no es todo. Previamente, se acusó a la startup de Sam Altman de recopilar enormes cantidades de datos de forma ilegal para utilizar en su chatbot. En tal sentido, se aseguró que OpenAI utilizó la técnica de web scrapping para "robar 300.000 millones de palabras de internet". Esto incluye libros, artículos y publicaciones, además de información identificable de personas.
Por supuesto que las acusaciones por usar material protegido por derechos de autor para entrenar modelos de IA no son nuevas. Ni tampoco se limitan a casos como los de ChatGPT y LLaMA. En su momento, Getty Images puso en el punto de mira a los creadores de Stable Diffusion por copiar sin permiso millones de fotografías de su base de datos. Y el fantasma de la piratería en la IA generativa y sus posibles repercusiones legales ha llegado, incluso, al mundo de los videojuegos.
En el caso de Sarah Silverman y los demás artistas que demandan a OpenAI y Meta, habrá varios interrogantes que resolver. Si bien los artistas aseguran que nunca dieron su consentimiento para que se entrene a los modelos de IA con sus libros, es difícil demostrar que los resúmenes creados por ChatGPT —u otras plataformas— sean a partir de las obras en sí misma, y no de críticas, análisis o ensayos que ya existan en la web.