Wayback Machine, cosa sta succedendo: sempre più siti limitano l’archivio del web
La Wayback Machine di Internet Archive, attiva dal 1996, ha accumulato oltre mille miliardi di pagine web, diventando lo strumento più ampio e accessibile per la conservazione delle informazioni digitali. Questo archivio, grazie ai suoi crawler automatici, permette a giornalisti, ricercatori e cittadini di recuperare pagine web modificate o rimosse, offrendo un contributo cruciale alla memoria storica del web e alla trasparenza pubblica. Recenti inchieste dimostrano il suo impiego pratico in analisi di dati governativi, sottolineando la sua importanza civica. Tuttavia, questa risorsa fondamentale si sta confrontando con blocchi crescenti da parte di importanti editori come USA Today, New York Times, Reddit e The Guardian, motivati in parte dalle controversie legali sul copyright nell'ambito dell'intelligenza artificiale. Nel tentativo di difendere i propri diritti, questi editori limitano o impediscono l'accesso dei crawler dell'archivio, riducendo l'accessibilità ai propri contenuti storici e, in alcuni casi, escludendo gli articoli dall'API pubblica. Questi blocchi riflettono una preoccupazione concreta verso l'uso massivo e automatico dei contenuti da parte di sistemi di IA, oltre a una strategia di tutela della proprietà intellettuale e dei dati aggregati. La conseguenza pratica per la comunità è la potenziale perdita o l'impossibilità di consultare integralmente importanti archivi giornalistici digitali nel futuro prossimo, soprattutto se non si svilupperanno alternative pubbliche comparabili. Ciò solleva interrogativi fondamentali sul controllo e sulla disponibilità della memoria digitale collettiva, che rischia di dipendere sempre più da pochi attori privati sotto crescente pressione legislativa e commerciale.