Lo scorso dicembre, il The New York Times ha avviato azioni legali contro OpenAI e il suo principale finanziatore, Microsoft, accusandoli di sfruttare milioni dei suoi articoli senza autorizzazione per addestrare chatbot destinati a fornire informazioni agli utenti.
In una dichiarazione presentata lunedì presso il tribunale federale di Manhattan, OpenAI ha chiesto ad un giudice federale di archiviare alcune parti della causa sul copyright del giornale contro di essa, sostenendo che il NYT ha hackerato il suo chatbot ChatGPT e altri sistemi di intelligenza artificiale per generare delle prove valide da utilizzare per il caso.
Nel documento legale ha dichiarato: “Le accuse contenute nella denuncia del Times non soddisfano i suoi famosi e rigorosi standard giornalistici. La verità, che verrà fuori nel corso di questo caso, è che il Times ha pagato qualcuno per hackerare i prodotti OpenAI. Ci sono voluti decine di migliaia di tentativi per generare i risultati altamente anomali. Sono stati in grado di farlo solo prendendo di mira e sfruttando un bug (che OpenAI si è impegnata a risolvere) utilizzando istruzioni ingannevoli che violano palesemente i termini di utilizzo di OpenAI. E anche allora, hanno dovuto alimentare lo strumento con porzioni degli stessi articoli di cui cercavano di ricavare passaggi letterali, praticamente tutti già presenti su più siti web pubblici”
OpenAI non ha nominato chi il Times avesse utilizzato per manipolare i suoi sistemi e non ha accusato il giornale di aver infranto alcuna legge anti-hacking.
L’“hacking” che OpenAI sostiene nel documento potrebbe anche essere chiamato prompt engineering o red-teaming, un modo comune utilizzato da team di fiducia e sicurezza dell’intelligenza artificiale, esperti di etica, accademici e aziende tecnologiche per testare sotto stress i sistemi di intelligenza artificiale per individuare eventuali vulnerabilità.
Ian Crosby, partner di Susman Godfrey e principale consulente legale del Times, in una dichiarazione alla CNBC, ha affermato: “Ciò che OpenAI definisce erroneamente come ‘hacking’ è semplicemente l’utilizzo dei prodotti OpenAI per cercare prove che abbiano rubato e riprodotto le opere protette da copyright del Times. E questo è esattamente ciò che abbiamo scoperto. In effetti, la portata della violazione di OpenAI è molto più ampia degli oltre 100 esempi indicati nella denuncia.”
È oramai noto a tutti che OpenAI ha costruito la propria attività “rastrellando” enormi aree di Internet. Artisti, autori, giornalisti e registi hanno tutti avuto il loro lavoro trovato dai web scraper dell’azienda ed è stato poi utilizzato per addestrare gli algoritmi dell’azienda che generano contenuti.
La stessa azienda presenziata da Altman in passato aveva dichiarato che addestrare i migliori modelli di intelligenza artificiale senza opere protette da copyright risultava impossibile “Poiché oggi il copyright copre praticamente ogni tipo di espressione umana, inclusi post di blog, fotografie, post di forum, frammenti di codice software e documenti governativi, sarebbe impossibile addestrare i principali modelli di intelligenza artificiale di oggi senza utilizzare materiali protetti da copyright”
Come abbiamo già evidenziato nella nostra precedente newsletter molti artisti e scrittori, hanno deciso di denunciare l’azienda per violazione del copyright, ma con scarsi risultati. I giudici, infatti, fino a questo momento hanno sempre dato ragione all’azienda.
OpenAI però si rende conto che la vittoria di un colosso come il Times al processo porterebbe inevitabilmente ad uno stravolgimento dell’ecosistema dell’IA e, proprio per questo, ha continuamente tentato di far respingere la causa dal tribunale, pima dichiarando che il giornale non aveva raccontato tutta la storia, ed ora accusandolo di aver prodotto prove illecite.