Durante l’ultimo Aspen Ideas Festival, un evento annuale che si tiene ad Aspen, Colorado dove vengono affrontati argomenti che spaziano dalla politica alla tecnologia, dall’economia alla cultura, dalla scienza all’arte, Mustafa Suleyman, capo dell’intelligenza artificiale di Microsoft, è intervenuto ed ha rilasciato dichiarazioni sul diritto d’autore che hanno generato molte critiche.
Suleyman ha sostenuto che i contenuti disponibili liberamente sul web possono essere copiati e utilizzati senza restrizioni, posizione controversa e problematica. È necessario precisare che l’addestramento dei modelli di linguaggio delle IA con dati prelevati senza alcuna autorizzazione, non solo viola il diritto di copyright ma, sostanzialmente, perdendosi la paternità dell’opera nelle elaborazioni di questi sistemi, il più fondamentale diritto d’autore.
Secondo Suleyman, “fin dagli anni ’90, è sempre esistito un contratto sociale che consente il fair use di tali contenuti. Chiunque può copiarli, ricrearli, riprodurli. Sono sempre stati considerati ‘freeware’, per così dire, questo è stato il patto”. Tuttavia, questa visione ignora che la pubblicazione di contenuti sul web non implica automaticamente la rinuncia ai diritti d’autore da parte dei creatori.
Il termine “freeware” a cui Suleyman si riferisce descrive un tipo di software distribuito gratuitamente, che può essere utilizzato senza costi ma che rimane comunque protetto da copyright. Solitamente, il freeware non autorizza la modifica o la redistribuzione del software stesso. Applicare questo concetto ai contenuti web è un errore che non considera le protezioni legali esistenti per gli autori.
La posizione di Suleyman rispecchia gli interessi di Microsoft e altre grandi aziende tecnologiche, che traggono vantaggio dall’utilizzo dei dati disponibili online per addestrare i loro modelli di intelligenza artificiale.
Come già sappiamo diversi autori e media americani, tra cui il New York Times, hanno avviato cause legali contro Microsoft e OpenAI, accusandole di utilizzare le proprie opere ed articoli senza autorizzazione per addestrare i loro modelli di IA.
Ricordiamo che Microsoft e OpenAI collaborano strettamente, con Microsoft che ha investito oltre 13 miliardi di dollari in OpenAI, investimento che ha permesso a Microsoft di integrare l’intelligenza artificiale generativa, come ad esempio Copilot, nei suoi principali prodotti, tra cui la suite Microsoft 365 e l’applicazione Teams. Questi investimenti hanno contribuito a una notevole crescita del valore di mercato di Microsoft.
E proprio il successo della tecnologia di Microsoft e OpenAI si basa in gran parte sulla vasta quantità di dati raccolti dal web aperto. Senza questi dati, prodotti principalmente da esseri umani, strumenti come ChatGPT e Copilot non sarebbero in grado di comprendere il linguaggio naturale e generare testo o immagini in modo simile a quello umano.
Proprio per questo tutte le aziende che sviluppano modelli di IA, tra cui Microsoft, sostengono che l’uso dei dati necessari per l’addestramento dei loro modelli rientra nel “fair use”.
Il fair use è una interpretazione del principio del diritto d’autore che, negli Stati Uniti, consente l’uso limitato di materiali protetti da copyright senza necessità di ottenere il permesso dai titolari dei diritti. Tuttavia, questo principio è soggetto a restrizioni basate sullo scopo dell’uso, la quantità di contenuto utilizzato e l’effetto sul mercato del contenuto originale: se l’uso dei contenuti per l’addestramento dell’IA riduce il mercato potenziale o il valore dell’opera originale, è meno probabile che tale uso sia considerato fair use, principio che, soprattutto in questi casi, dovrà essere stabilito in tribunale.