Meta usa libros pirateados para su IA y desata la polémica

Meta piratea libros para entrenar a su inteligencia artificial

Meta, la empresa anteriormente conocida como Facebook, ha admitido que ha utilizado millones de libros pirateados para entrenar a su inteligencia artificial (IA) en el procesamiento del lenguaje natural (PLN). Esta práctica ha generado una fuerte controversia entre los autores, editores y defensores de los derechos de autor, que acusan a Meta de violar la ley y de explotar el trabajo ajeno sin compensación.

¿Qué es el PLN y por qué Meta necesita libros?

El PLN es una rama de la IA que se ocupa de analizar, comprender y generar lenguaje humano, tanto hablado como escrito. El PLN tiene muchas aplicaciones, como la traducción automática, el resumen de textos, la generación de contenidos, el reconocimiento de voz, el análisis de sentimientos, etc.

Para que una IA pueda aprender a manejar el lenguaje humano, necesita una gran cantidad de datos, es decir, textos de diferentes fuentes, géneros, estilos y temas. Cuanto más variados y amplios sean los datos, mejor será el rendimiento de la IA.

Meta es una de las empresas líderes en el desarrollo de IA, especialmente en el campo del PLN. Meta utiliza su IA para mejorar sus productos y servicios, como el asistente virtual M, el chatbot Blender, el sistema de moderación de contenidos, el buscador de Bing, etc.

Para alimentar a su IA, Meta necesita una enorme cantidad de libros, que son una fuente rica y diversa de lenguaje. Sin embargo, obtener los derechos de uso de esos libros no es fácil ni barato, ya que implica negociar con los autores, los editores y las entidades de gestión de derechos de autor.

¿Cómo y por qué Meta piratea libros?

Según una investigación publicada por el medio The Markup, Meta ha recurrido a una forma de piratería digital para obtener los libros que necesita para su IA. El método consiste en utilizar un software llamado Library Genesis (LibGen), que es una plataforma que almacena y distribuye millones de libros y artículos científicos sin autorización de sus creadores.

LibGen funciona como una red peer-to-peer (P2P), es decir, una red de ordenadores que se conectan entre sí para compartir archivos. Cualquier usuario puede acceder a LibGen y descargar los libros que quiera de forma gratuita, o subir los que tenga en su poder. LibGen no tiene un servidor central, sino que se basa en varios servidores espejo repartidos por el mundo, lo que dificulta su localización y cierre.

Meta ha utilizado LibGen para descargar más de 22 millones de libros en varios idiomas, según los datos obtenidos por The Markup. Estos libros forman parte de un conjunto de datos llamado CC-Net, que Meta utiliza para entrenar a su IA en el PLN. CC-Net contiene más de 570 mil millones de palabras extraídas de la web, incluyendo los libros pirateados.

Meta ha justificado su uso de LibGen alegando que se trata de una práctica legal y ética, amparada por el principio de uso justo. El uso justo es una excepción al derecho de autor que permite el uso limitado de obras protegidas sin necesidad de permiso, siempre que se cumplan ciertos requisitos, como el propósito educativo, la naturaleza no comercial, la cantidad y calidad del material utilizado y el efecto sobre el mercado potencial de la obra.

Meta ha argumentado que su uso de LibGen cumple con estos requisitos, ya que su objetivo es avanzar en el conocimiento científico, no obtener beneficios directos, no divulgar ni distribuir los libros y no afectar a las ventas ni a la reputación de los autores.

¿Qué consecuencias tiene la piratería de Meta?

La piratería de Meta ha generado una gran polémica y una fuerte oposición por parte de los afectados por esta práctica. Los autores, los editores y las entidades de gestión de derechos de autor han denunciado que Meta está violando la ley y la ética, y que está causando un grave daño al sector editorial y a la cultura.

Los críticos de Meta han señalado que su uso de LibGen no cumple con los requisitos del uso justo, ya que Meta sí obtiene beneficios indirectos de su IA, que utiliza los libros sin citar ni reconocer a sus autores, que copia una cantidad y calidad sustancial de las obras y que perjudica al mercado potencial de las mismas, al reducir el incentivo y la recompensa de los creadores.

Los opositores a Meta han exigido que Meta deje de usar LibGen, que borre los libros pirateados de su conjunto de datos, que pida disculpas públicas y que compense económicamente a los autores y editores por el uso indebido de sus obras. Además, han pedido que se regule y se controle el uso de la IA y de los datos, para evitar que se repitan casos como este.

Meta, por su parte, ha defendido su postura y ha rechazado las acusaciones y las demandas. Meta ha afirmado que su uso de LibGen es legal y ético, y que no tiene intención de cambiar su política ni de pagar ninguna compensación. Meta ha alegado que su uso de LibGen beneficia al interés público, al fomentar el progreso de la ciencia y la tecnología, y al facilitar el acceso a la información y al conocimiento.

¿Qué opinas tú?

La piratería de Meta plantea un dilema moral y legal, que enfrenta los intereses de los creadores y los usuarios de la IA. ¿Qué opinas tú? ¿Crees que Meta tiene derecho a usar LibGen para entrenar a su IA? ¿O crees que Meta está abusando de los derechos de los autores y editores? ¿Qué solución propondrías para resolver este conflicto?

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Visitas: 0
Ads Blocker Image Powered by Code Help Pro

¡Bloqueador de anuncios detectado!

Hemos detectado que estás utilizando extensiones para bloquear anuncios.
Apóyanos desactivando este bloqueador de anuncios.
Powered By
100% Free SEO Tools - Tool Kits PRO