Meta e i libri pirata: la condivisione via torrent per addestrare l'AI è fair use?

Il colosso di Zuckerberg sostiene che scaricare e ridistribuire milioni di opere protette da copyright sia lecito se finalizzato all'addestramento dell'intelligenza artificiale. Ma la questione è tutt'altro che chiusa.

* Il caso: milioni di libri scaricati via torrent * La difesa di Meta: il fair use come scudo giuridico * Il nodo della condivisione tramite torrent * Il precedente del 2024 e le sue implicazioni * E in Italia? Il diritto d'autore nell'era dell'AI * Una partita ancora tutta da giocare

Il caso: milioni di libri scaricati via torrent {#il-caso-milioni-di-libri-scaricati-via-torrent}

La vicenda ha contorni che, fino a pochi anni fa, sarebbero parsi incredibili. Meta, il colosso fondato da Mark Zuckerberg, ha scaricato e condiviso milioni di libri protetti da copyright utilizzando la rete torrent — lo stesso sistema peer-to-peer storicamente associato alla pirateria digitale — con l'obiettivo dichiarato di addestrare i propri modelli di intelligenza artificiale.

Non si tratta di un'accusa generica. L'azienda sta affrontando una class action intentata da autori e titolari di diritti che contestano la violazione sistematica del diritto d'autore. La portata dell'operazione è enorme: parliamo di dataset composti da opere letterarie, saggi, manuali — un patrimonio intellettuale massiccio trasformato in materiale di addestramento per i sistemi AI di Meta, tra cui la famiglia di modelli Llama, che ha recentemente raggiunto traguardi significativi come raccontato nell'approfondimento su Llama di Meta: Un Miliardo di Download e Nuove Applicazioni Innovative.

La difesa di Meta: il fair use come scudo giuridico {#la-difesa-di-meta-il-fair-use-come-scudo-giuridico}

La linea difensiva dell'azienda ruota attorno a un concetto cardine del diritto americano: il fair use. Stando a quanto emerge dagli atti processuali, Meta sostiene che l'utilizzo di opere protette per l'addestramento dell'intelligenza artificiale rappresenti un uso trasformativo, dunque lecito. L'opera originale non viene riprodotta né messa a disposizione del pubblico nella sua forma integrale: viene piuttosto "digerita" dagli algoritmi, scomposta in pattern statistici, trasformata in conoscenza computazionale.

È un argomento che ha trovato, almeno parzialmente, terreno fertile nelle aule di tribunale. Ma la questione non si esaurisce qui.

Il nodo della condivisione tramite torrent {#il-nodo-della-condivisione-tramite-torrent}

Ecco il punto critico. Il protocollo BitTorrent funziona secondo un principio di reciprocità: chi scarica un file, automaticamente lo rende disponibile ad altri utenti della rete. Non esiste download senza upload. Meta ne è consapevole e, anzi, ne fa un elemento della propria difesa.

L'azienda afferma che la condivisione dei libri scaricati è una conseguenza tecnica inevitabile, "parte integrante" del processo di download tramite torrent. In altre parole: non si può scaricare senza condividere, e se il download è legittimo — perché rientra nel fair use — allora anche la condivisione lo è.

Gli accusatori ribattono che questa lettura è inaccettabile. La condivisione di opere protette, a prescindere dal meccanismo tecnico che la genera, costituisce una violazione del copyright autonoma e distinta. Redistribuire milioni di libri sulla rete torrent non è un effetto collaterale trascurabile: è pirateria su scala industriale, aggravata dal fatto che a compierla è una delle aziende più ricche del pianeta.

Il precedente del 2024 e le sue implicazioni {#il-precedente-del-2024-e-le-sue-implicazioni}

A complicare ulteriormente il quadro c'è una sentenza del 2024 che ha rappresentato un momento di svolta. Un tribunale statunitense ha stabilito che l'uso di libri protetti da copyright per l'addestramento di modelli AI può effettivamente rientrare nel fair use. La decisione ha fatto scuola, creando un precedente su cui Meta ora fa leva con decisione.

Tuttavia, quella sentenza non affrontava specificamente la questione della redistribuzione via torrent. Il fair use applicato al training non copre automaticamente ogni fase del processo di acquisizione dei dati. È su questo scarto che si gioca la partita legale: una cosa è utilizzare materiale protetto per un fine trasformativo, altra cosa è diffonderlo nella rete attraverso canali notoriamente associati alla pirateria.

Il dibattito investe questioni profonde. Fin dove può spingersi il diritto delle aziende tecnologiche di appropriarsi del lavoro intellettuale altrui? E soprattutto: chi paga il conto di questa "innovazione"?

E in Italia? Il diritto d'autore nell'era dell'AI {#e-in-italia-il-diritto-dautore-nellera-dellai}

La dottrina del fair use è un istituto tipico del sistema giuridico anglosassone. In Italia e nell'Unione Europea il quadro normativo è diverso e, per certi versi, più restrittivo. La Legge sul diritto d'autore (L. 633/1941) e le direttive europee — in particolare la Direttiva Copyright 2019/790 — prevedono eccezioni per il text and data mining a fini di ricerca scientifica, ma pongono limiti precisi.

L'articolo 4 della direttiva consente il text and data mining commerciale solo se i titolari dei diritti non lo hanno espressamente vietato attraverso mezzi tecnici o dichiarazioni leggibili dalle macchine (il cosiddetto _opt-out_). Un meccanismo che, almeno sulla carta, offre agli autori una tutela che il sistema americano non garantisce con altrettanta chiarezza.

Resta da capire, però, quanto questi strumenti siano realmente efficaci. In un ecosistema digitale in cui i dataset di addestramento vengono assemblati in modo opaco, spesso senza trasparenza sulle fonti, l'_opt-out_ rischia di restare una protezione più teorica che pratica.

Nel frattempo, Meta continua a investire massicciamente nell'intelligenza artificiale, come dimostra anche il recente lancio di un chip IA proprietario per contrastare il dominio di Nvidia. L'addestramento dei modelli richiede quantità crescenti di dati, e la tentazione di attingere a ogni fonte disponibile — lecita o meno — è fortissima.

Una partita ancora tutta da giocare {#una-partita-ancora-tutta-da-giocare}

La class action contro Meta è destinata a diventare un caso di riferimento. Non solo per l'esito processuale in sé, ma per il messaggio che invierà all'intero settore tecnologico. Se la linea del fair use dovesse prevalere anche sulla questione della redistribuzione via torrent, si aprirebbe un varco enorme: di fatto, qualsiasi azienda potrebbe giustificare il download e la condivisione di materiale pirata invocando la finalità di addestramento AI.

Viceversa, una condanna rafforzerebbe la posizione di autori, editori e titolari di diritti, imponendo alle big tech di negoziare licenze e compensi per l'utilizzo delle opere.

La posta in gioco va ben oltre i confini del diritto d'autore tradizionale. Riguarda il rapporto di forza tra chi crea contenuti e chi li utilizza per generare profitti miliardari, il ruolo della regolamentazione pubblica nell'era dell'intelligenza artificiale, il futuro stesso della produzione culturale e scientifica. Una partita che, al momento, resta apertissima.

Meta e i libri pirata: la condivisione via torrent per addestrare l'AI è fair use?

Il caso: milioni di libri scaricati via torrent {#il-caso-milioni-di-libri-scaricati-via-torrent}

La difesa di Meta: il fair use come scudo giuridico {#la-difesa-di-meta-il-fair-use-come-scudo-giuridico}

Il nodo della condivisione tramite torrent {#il-nodo-della-condivisione-tramite-torrent}

Il precedente del 2024 e le sue implicazioni {#il-precedente-del-2024-e-le-sue-implicazioni}

E in Italia? Il diritto d'autore nell'era dell'AI {#e-in-italia-il-diritto-dautore-nellera-dellai}

Una partita ancora tutta da giocare {#una-partita-ancora-tutta-da-giocare}

Articoli Correlati

Chirurgia robotica e sistema Da Vinci: vantaggi, struttura e limiti

Anziani sui social: il paradosso italiano tra rischi e nuove tutele

A Manciano sei pale da 220 metri: in Maremma altri 14 progetti in coda