Su contenido en línea es material gratuito para módulos de capacitación • Registro

Mustafa Suleiman, director ejecutivo de inteligencia artificial de Microsoft, dijo esta semana que las empresas de aprendizaje automático pueden extraer la mayor parte del contenido publicado en línea y utilizarlo para entrenar redes neuronales porque es esencialmente «software libre».

Poco después se creó el Centro de Periodismo de Investigación. Presentar una demanda contra OpenAI Su mayor inversor, Microsoft, “por utilizar el contenido de una organización de noticias sin fines de lucro sin permiso ni compensación”.

Esto sigue los pasos de ocho periódicos Presentó una demanda contra OpenAI y Microsoft En abril, The New York Times acusó a Facebook de presunta apropiación indebida de contenidos, algo que el mismo periódico había hecho cuatro meses antes.

Luego están los dos brillantes autores. Presentó una demanda contra OpenAI y Microsoft En enero afirmaron que habían entrenado modelos de IA en las obras de los autores sin permiso. Además, en 2022, varios desarrolladores anónimos presentaron una demanda contra OpenAI y GitHub basándose en acusaciones de que las organizaciones utilizaron código publicado públicamente para entrenar modelos generativos en violación de los términos de su licencia de software.

preguntado en Entrevista Hablando con Andrew Ross Sorkin de CNBC en el Festival de Ideas de Aspen sobre si las empresas de inteligencia artificial han robado efectivamente la propiedad intelectual del mundo, Solomon reconoció la controversia y trató de distinguir entre el contenido que la gente pone en línea y el contenido respaldado por titulares corporativos de derechos de autor.

«Creo que en términos de contenido que ya existe en la web abierta, el contrato social para ese contenido desde la década de 1990 ha sido el uso legítimo», dijo. «Cualquiera podía copiarlo, recrearlo, reproducirlo con él. Era software libre, si quería. Ese era el entendimiento».

Suleiman señaló que hay otra categoría de contenido, que son los materiales publicados por empresas que tienen abogados.

«Hay una categoría separada donde un sitio web, editor u organización de noticias ha dicho explícitamente: ‘No me elimines ni me rastrees por ningún motivo que no sea el de indexarme, para que otros puedan encontrar este contenido'», explicó. «Pero esa es un área gris. Creo que esto llegará a los tribunales».

Esto es por decirlo suavemente. Si bien parece seguro que las declaraciones de Soliman ofenderán a los creadores de contenido, no está del todo equivocado: no está claro dónde se encuentran las líneas legales con respecto al entrenamiento y la producción de modelos de IA.

La mayoría de las personas que publican contenido en línea como individuos han violado sus derechos de alguna manera al aceptar acuerdos de términos de servicio ofrecidos por las principales plataformas de redes sociales. La decisión de Reddit de otorgar licencias a OpenAI para las publicaciones de sus usuarios no sucedería si el gigante de las redes sociales creyera que sus usuarios tienen un derecho legítimo a los memes y los datos que difunde.

El hecho de que OpenAI y otras empresas que fabrican modelos de IA estén cerrando acuerdos de contenido con los principales editores muestra que una marca fuerte, suficiente dinero y un equipo legal pueden poner sobre la mesa grandes operaciones tecnológicas.

En otras palabras, quienes crean contenido y lo publican en línea están creando software libre a menos que contraten, o puedan atraer, abogados dispuestos a desafiar a Microsoft y sus semejantes.

en papel En un estudio publicado por SSRN el mes pasado, Frank Pasquale, profesor de derecho en Cornell Tech y Cornell Law School en los EE. UU., y Haochen Sun, profesor asociado de derecho en la Universidad de Hong Kong, exploran la incertidumbre legal que rodea el uso de datos protegidos por derechos de autor para entrenar inteligencia artificial y si los tribunales considerarían que dicho uso es justo. Concluyen que la IA debe abordarse a nivel de políticas, porque las leyes actuales son inadecuadas para responder las preguntas que ahora es necesario abordar.

“Debido a que existe una incertidumbre significativa sobre la legalidad del uso de obras protegidas por derechos de autor por parte de los proveedores de IA, los legisladores necesitarán articular una nueva y audaz visión para reequilibrar los derechos y responsabilidades, tal como lo hicieron a raíz del desarrollo de Internet (que condujo a la Digital Millennium Copyright Act y publicación en 1998), como afirman.

Los autores señalan que la actual cosecha no compensada de obras creativas amenaza no sólo a escritores, compositores, periodistas, actores y otros profesionales creativos, sino también a la propia inteligencia artificial, que acabará privada de datos de entrenamiento. Los autores predicen que la gente dejará de publicar su trabajo en línea si solo se utiliza para impulsar modelos de inteligencia artificial que reduzcan el costo marginal de la creación de contenido a cero y nieguen a los creadores la posibilidad de recibir alguna recompensa.

Este es el futuro que prevé Salomón. “La economía de la información está a punto de cambiar radicalmente porque somos capaces de reducir a cero los costos de producción de conocimiento en términos de costo marginal”, afirma.

Todo el software gratuito que probablemente ayudó a crear puede ser suyo por una pequeña tarifa de suscripción mensual. ®

Revista Arte

Su contenido en línea es material gratuito para módulos de capacitación • Registro

Sobre el autor

Sus últimos artículos

Revistas

LA COMUNIDAD ARTE

JUEGOS EN ES.PAPERBLOG.COM