Immagine realizzata con IA Dall-E

Il 22 novembre il Garante per la protezione dei dati personali ha comunicato di aver avviato una indagine conoscitiva sui siti internet pubblici e privati per verificare l’adozione di idonee misure di sicurezza adeguate ad impedire la raccolta massiva (webscraping) di dati personali a fini di addestramento degli algoritmi di intelligenza artificiale (IA) da parte di soggetti terzi.

L’indagine conoscitiva riguarda tutti i soggetti pubblici e privati, operanti quali titolari del trattamento, stabiliti in Italia o che offrono in Italia servizi, che mettono a disposizione on-line dati personali liberamente accessibili anche dagli “spider” dei produttori di algoritmi di intelligenza artificiale.

Mentre i tutori della Privacy guardano al webscraping dal punto di vista della protezione dei dati personali, continua su vari fronti la battaglia per la violazione del copyright, soprattutto da parte dei grandi editori.

Le case editrici News Corp e IAC (IAC=InterActiveCorp, un complesso mediatico proprietario, fra l’altro, dei marchi Expedia.com e TripAdvisor)  hanno espresso forte disappunto verso le compagnie che sviluppano intelligenza artificiale generativa per l’utilizzo non autorizzato dei loro contenuti editoriali senza compenso. Per questo, hanno adottato misure protettive e proposto accordi di condivisione delle entrate e la formazione di coalizioni per negoziare pagamenti.

Tuttavia, i risultati di tali sforzi non sono stati omogenei. Il CEO di News Corp, durante una recente teleconferenza per la presentazione dei bilanci aziendali, ha rivelato trattative avanzate con aziende digitali per l’uso remunerativo dei propri contenuti. Alcuni editori hanno quindi deciso di stringere proprie partnership di licenza con società di intelligenza artificiale generativa.

Nonostante ciò, i progressi complessivi delle negoziazioni guidate da Barry Diller di IAC sono stati limitati, con alcune grandi pubblicazioni che hanno scelto di ritirarsi dalla coalizione o di perseguire azioni legali indipendenti. L’AP ha negoziato un accordo di questo tipo con OpenAI a luglio, in base al quale OpenAI sta pagando per concedere in licenza parte dell’archivio di testo di AP per addestrare i suoi modelli.

La questione della protezione della proprietà intellettuale contro l’uso da parte delle aziende tecnologiche di modelli di lingua di grande dimensione (LLMs) rimane aperta, con diversi esponenti del settore che invocano una soluzione legale e una maggiore regolamentazione governativa per affrontare i problemi posti dall’IA nella creazione di contenuti​.