Reddit, il social media statunitense, ha recentemente stretto un accordo con un’azienda di intelligenza artificiale, della quale non si sa il nome, per fornirle i dati dei suoi utenti. Secondo quanto riportato da Bloomberg, il contratto ha un valore di circa 60 milioni di dollari all’anno e fa parte della strategia di Reddit per aumentare le proprie entrate in vista della sua imminente quotazione in borsa.

L’accordo prevede che Reddit conceda all’azienda l’accesso ai post e ai commenti degli utenti, che verranno utilizzati per addestrare modelli di intelligenza artificiale.

Il contratto (e le controversie ad esso associate) si basa sulla concessione dell’utilizzo delle API (interfaccia di programmazione delle applicazioni) di Reddit, per consentire l’accesso ai dati del sito web.

Reddit rappresenta una fonte di dati ricca e variegata, contenente post e commenti di milioni di utenti su una vasta gamma di argomenti, accumulati negli ultimi 18 anni.

La cessione dell’uso delle API da parte di Reddit non è una novità: infatti, a partire da aprile 2020, Reddit ha iniziato a tariffare l’accesso alle API, offrendo diverse opzioni di prezzo in base alle esigenze dei clienti. Già all’epoca gli sviluppatori si erano opposti alla decisione di Reddit di monetizzare l’accesso alle API, che precedentemente erano gratuite e le comunità interne a Reddit avevano protestato contro questa decisione, chiudendo temporaneamente i propri servizi causando disagi al funzionamento del sito.

La differenza con quest’accordo è questione di scala e di privacy: gli utenti hanno lamentato la vendita dei propri dati senza consenso e il potenziale rischio di violazione della privacy e dei diritti personali.

Per Reddit, l’accordo rappresenta un tentativo di aumentare le entrate e di attrarre investitori in vista della quotazione in borsa prevista per il 2024, con una valutazione stimata di 5 miliardi di dollari.

Dal punto di vista del settore dell’intelligenza artificiale, in particolare per quanto riguarda l’intelligenza artificiale generativa, questo contratto ha ripercussioni significative. Le aziende che operano in questo ambito stanno cercando di migliorare i loro modelli linguistici di grandi dimensioni (LLM), che sono in grado di generare testi coerenti e realistici.

Per farlo, hanno bisogno di dati di alta qualità e quantità, che possono essere ottenuti da fonti come Reddit.

Reddit non è il primo a seguire questa strategia, ricordiamo già due casi simili di cui abbiamo già parlato: da un lato  l’accordo di Axel Springer, uno dei principali gruppi di media digitali in Europa, con OpenAI, leader nel campo dell’intelligenza artificiale, per consentire l’addestramento dei suoi modelli IA con i dati delle proprie testate; dall’altro Apple che sta esplorando la possibilità di stabilire accordi pluriennali con editori per ottenere l’accesso alle notizie.