Poe, un chatbot IA sviluppato da Quora, piattaforma forum dove gli utenti possono pubblicare domande e risposte su qualunque argomento, è capace di aggirare i paywall, le protezioni dei giornali e dei siti di informazione e leggerne i contenuti.
WIRED lo ha scoperto verificando che Poe riusciva a superare il proprio paywall e quello di giornali come The New York Times, Bloomberg Businessweek, The Atlantic, Forbes, Defector e 404 Media, semplicemente inserendo la URL del sito nell’interfaccia del bot assistant.
Poe aggira i paywall bypassando il codice JavaScript su cui poggia la struttura informatica degli stessi.
Come riporta Wired, James Grimmelmann, professore di diritto digitale e dell’informazione alla Cornell University, ha commentato: “Si tratta di un problema di copyright molto serio. Poiché hanno fatto una copia sul loro server” (e di diritto d’autore ci viene da osservare).
Inoltre Poe consente agli utenti di scaricare, in forma di allegato, una copia HTML delle pagine dei siti.
In sostanza, secondo i log del server di Wired, subito dopo che al bot assistant è stato richiesto di riepilogare il sito, un server che si identifica come “Quora Bot” ha visitato il sito e la cosa più grave è che il bot ha del tutto ignorato il file robots.txt, suggerendo che Poe e Quora violino il Robots Exclusion Protocol, lo standard web internazionale ampiamente accettato anche se non legalmente vincolante.
In risposta, il portavoce di Quora, Autumn Besselman, ha scritto in una e-mail che: “Poe è una piattaforma che permette agli utenti di fare domande e dialogare con vari bot basati su intelligenza artificiale forniti da terze parti. Non abbiamo né addestriamo i nostri modelli di intelligenza artificiale senza autorizzazioni.”
Besselman ha inoltre sottolineato che Poe dispone di una funzionalità che consente a un utente di mostrare il contenuto di una URL a un bot, ma il bot visualizzerà solo il contenuto fornito dal dominio. Ha anche espresso la disponibilità a collaborare con i team tecnici dei fornitori di contenuti a pagamento per garantire che tali contenuti non siano accessibili tramite la piattaforma.
Infine, ha aggiunto: “Gli allegati di file su Poe vengono creati su richiesta degli utenti e funzionano in modo simile ai servizi di archiviazione cloud, ai servizi ‘leggi più tardi’ e ai prodotti ‘web clipper’, che riteniamo siano tutti conformi alla legge sul copyright”.