Abbonati

a

Scopri L’America dopo l’egemonia

L’ultimo numero della rivista di Aliseo, dedicato al futuro degli Stati Uniti. 14 analisi per capire l’America, dalla geopolitica alla crisi interna

Perché ChatGPT ha bisogno dei giornali per sopravvivere

Perché ChatGPT ha bisogno dei giornali per sopravvivere

Quando nel 1997 Garry Kasparov perse contro Deep Blue, un computer sviluppato da Ibm in grado di giocare a scacchi, qualcosa è cambiato. Era la prima volta che un umano veniva sconfitto da una macchina ad un gioco di strategia. Si sapeva già che i computer potessero effettuare calcoli e immagazzinare dati in maniera infinitamente […]
Foto logo ChatGpt

Quando nel 1997 Garry Kasparov perse contro Deep Blue, un computer sviluppato da Ibm in grado di giocare a scacchi, qualcosa è cambiato. Era la prima volta che un umano veniva sconfitto da una macchina ad un gioco di strategia. Si sapeva già che i computer potessero effettuare calcoli e immagazzinare dati in maniera infinitamente migliore di quanto qualsiasi creatura vivente potesse fare, ma sembrava impossibile che tale potenza di calcolo potesse superare il miglior rappresentante della nostra specie in uno dei giochi più complessi mai realizzati.

E Kasparov aveva in effetti smentito questa tesi. Aveva affrontato il computer un anno prima, battendolo agevolmente. Ma Ibm migliorò ulteriormente le sue strutture, e al secondo incontro Kasparov uscì sconfitto con il punteggio di 3.5 a 2.5 per Deep Blue. Un margine risicato ma chiaro: l’uomo aveva perso il suo predominio sulla scacchiera. 

Ad oggi nessuno giocatore di scacchi pretende di poter battere un computer, al contrario ha la consapevolezza di non poterci andare neanche vicino. I successori di Deep Blue, con ancor maggior potenza di calcolo, prevedono praticamente tutte le posizioni possibili con una profondità di moltissime mosse (ovvero riescono a visualizzare quasi ogni posizione possibile dalla situazione attuale fino a 10/15 mosse avanti, scegliendo man mano la strada che porta più vantaggio). Una tale comprensione del gioco è semplicemente impossibile per un umano.

Il go e Sidol fino a ChatGpt

L’umanità rimaneva imbattuta in un altro gioco di strategia, come raccontato da Benjamin Latout nel suo “Maniac”: il go. Il gioco cinese in cui ci sono solo pedine bianche e nere e miliardi di combinazioni in più rispetto agli scacchi. Qui la potenza di calcolo non basta. Tutti i migliori giocatori mantengono una condotta intuitiva durante la partita, basandosi su esperienze e leggi che si tramandano da secoli nelle varie scuole. 

Eppure Lee Sidol, il miglior giocatore al mondo, considerato colui che aveva portato il go a un nuovo livello di profondità e qualità, venne battuto nel 2016 da un’intelligenza artificiale, Alpha Go, con il punteggio di 4-1. Un risultato semplicemente strabiliante, perché non si basava sulla semplice previsione di cosa sarebbe successo sulla scacchiera. Alpha Go stava ragionando sulle possibili varianti e agiva in base a quella che lo stesso Sidol ha definito “intuizione”.

Come è stato possibile raggiungere un risultato del genere venne spiegato dagli sviluppatori del sistema. AlphaGo aveva appreso il regolamento, dopo di che aveva analizzato migliaia di partite di medio livello di giocatori umani. Questo ha fornito milioni di dati su cui l’intelligenza artificiale ha potuto creare numerosi parametri. Ad un secondo livello, il sistema ha iniziato a giocare contro se stesso migliaia di partite, creando ancora più informazioni su cui basarsi. 

Questo gigantesco serbatoio di esperienza ha causato la sconfitta del miglior giocatore di sempre. Per quanto abile e forte, Sidol non avrebbe mai potuto memorizzare milioni di match. 

Il dettaglio insieme più inquietante e affascinante, è che quando gli sviluppatori hanno eliminato dalla memoria di AlphaGo le partite dei giocatori umani di medio livello, lasciando solamente le partite giocate dall’intelligenza artificiale, il sistema non ha mai più perso una partita.

L’importanza di buone partite e del giornalismo di qualità per ChatGpt

Oggi, i sistemi di intelligenza artificiale generativa come ChatGpt poggiano sulle stesse basi teoriche. È impossibile creare frasi o immagini da zero semplicemente calcolando tutte le possibilità, seguendo il procedimento di Deep Blue. Al contrario, servono parametri su cui basarsi in relazione al “prompt, la richiesta che il sistema ha ricevuto, esattamente come AlphaGo con le mosse dell’avversario.

Ad esempio, quando si chiede a ChatGpt di creare un articolo giornalistico sulla partita di campionato tra Juventus e Napoli, il sistema sceglie tutti i dati in suo possesso che hanno a che fare con uno stile tipico del giornalismo sportivo, dopo di che elabora le frasi basandosi sugli articoli scritti nel passato. Così, in pochi secondi, elabora un contenuto frutto di migliaia di altri testi presi a modello.

È questo il motivo per cui questi sistemi sono in grado di cambiare stile e poter scrivere come Trump, come il vostro cantante preferito o come il papa. Selezionano solo i dati relativi a quella cifra stilistica, individuano i parametri che la contraddistinguono e li usano per produrre nuovi contenuti. Lo stesso vale per la creazione di immagini. 

La pietra di volta su cui poggia tutto l’edificio di questo tipo di intelligenza artificiale è la qualità dei contenuti che vengono utilizzati per l’apprendimento. Se le partite a disposizione di Alpha Go fossero state di basso livello, e non avesse potuto giocare contro sé stesso, il sistema sarebbe rimasto ad un livello mediocre. Allo stesso modo, se ChatGpt non avesse accesso a scritti di qualità, il suo stile sarebbe scadente, con errori sintattici e logici. inoltre, poichè l’apprendimento è sempre in corso, possono sempre svilupparsi problemi etici o di inaccuratezza.

L’Ia funziona perché è in grado di selezionare parametri sempre migliori, man mano che i dati in suo possesso aumentano, e quindi di prendere decisioni migliori. Da qui deriva l’importanza vitale di “nutrire” le intelligenze generative con contenuti di qualità, soprattutto se si vuole che diventino utili strumenti sul posto di lavoro. Ecco allora l’esigenza dei crawler

La “pesca a strascico dei dati” e lo scontro con le normative copyright

I crawler sono i software con cui i sistemi di Ia si riforniscono di dati. In particolare, ChatGpt ha lanciato l’8 agosto 2023 “GPTBot, costruito in modo da scaricare e indicizzare i contenuti delle pagine web. In questo modo riesce a raccogliere informazioni e catalogarle in maniera ordinata, rendendo sempre più preciso e accurato il sistema. Più dati sono disponibili, maggiore sarà la capacità dell’IA in questione di rispondere ai prompt. 

La brutta notizia per OpenAi, la società che possiede ChatGpt è che, poche settimane dopo il lancio del crawler, il 10% circa delle pagine più influenti del web lo aveva già bloccato, negandogli l’accesso ai suoi contenuti,. Questo numero non ha fatto che salire durante il 2024. 

Tra questi siti anche grandi nomi come Amazon, Quora, Lonely Planet e, soprattutto, testate giornalistiche come il New York Times, il Washington Post, la CNN, Chicago Tribune, Blooomberg e agenzie stampa quali Reuters. La motivazione alla base è sempre la stessa: si vuole impedire che OpenAi possa migliorare il proprio sistema sfruttando contenuti di alta qualità senza il consenso di chi li possiede.

Alla fine del 2023, ad esempio, il celebre giornale britannico Guardian ha dichiarato che “la pesca a strascico per scopi commerciali dei dati soggetti a proprietà intellettuale presenti sul sito web del Guardian è, ed è sempre stata, una pratica contraria ai nostri termini di servizio” e che avrebbe bloccato GPTBot.

OpenAi ha ammesso che, senza i contenuti di alta qualità protetta da copyright, sarebbe impossibile addestrare i modelli di intelligenza artificiale: “poiché oggi il diritto d’autore copre praticamente ogni tipo di espressione umana – inclusi post di blog, fotografie, post di forum, frammenti di codice software e documenti governativi – sarebbe impossibile addestrare i principali modelli di Intelligenza Artificiale odierni senza utilizzare materiali protetti dal diritto d’autore” si legge in una lettera inviata alla commissione “Comunicazione e digitale” della Camera dei Lord nel Regno Unito. 

Il fair use e i problemi di rigurgito di ChatGpt

OpenAi si sarebbe trovata così in una posizione scomoda e senza precedenti nella storia della tecnologia. È la prima società a fronteggiare una situazione di questo tipo: riceve investimenti miliardari ma rischia di peggiorare il proprio servizio a causa dell’opposizione di altre aziende, che non vogliono cedergli i diritti d’autore. 

Inizialmente, la società americana si è appellata al “fair use”, all’utilizzo corretto dei contenuti anche senza pagarne la licenza. ChatGpt, infatti, non copia gli articoli da cui apprende, ma li utilizza solo per migliorarsi.

Nessuno denuncerebbe un professore universitario per aver pubblicato un articolo sfruttando le conoscenze acquisite dagli studiosi prima di lui. Allo stesso modo, sostiene OpenAi, il loro software si limita a raccogliere le informazioni che serviranno a produrre qualcosa di nuovo. “Crediamo che il copyright non proibisca l’apprendimento” ha dichiarato OpenAI nel documento proposto alla Camera dei Lord.

Questo è un problema spinoso, che non è stato ancora affrontato dal punto di vista legale. Si tratta di definire l’attività che ChatGpt sta svolgendo e se il diritto che l’uomo ha di informarsi e produrre conoscenza possa essere esteso anche alle macchine. 

Nel frattempo, un problema si è già verificato: è quello del “rigurgito”, un bug per cui Chat GPT e altri sistemi analoghi copiano quasi integralmente un articolo, senza citarne la fonte, nel tentativo di rispondere all’utente. Non capita spesso, ma se questo problema non dovesse essere risolto, la difesa imperniata sul “fair use” cadrebbe senza riserve. 

La denuncia del New York Times

In questa storia di prime volte, è la prima volta che un giornale denuncia OpenAi per violazione del copyright. La denuncia del New York Times è stata depositata nella corte distrettuale di New York il 27 dicembre 2023. Lunga 69 pagine, fa leva sull’importanza del giornalismo di qualità per la difesa della democrazia e afferma che l’appropriazione di milioni di contenuti da parte di Chat GPT metta in pericolo il loro lavoro a causa del danno economico arrecato al “business model” del giornalismo.

La sede del New York Times

Il New York Times sostiene che il giornalismo di qualità deve essere finanziato anche nel suo formato digitale, e questo è possibile solo se gli utenti interagiscono sul sito e acquistano abbonamenti. ChatGPT metterebbe in pericolo questo modello perché fornisce risposte basate sugli articoli prodotti, senza la necessità di pagare per essi. 

I documenti della testata americana usati da OpenAi sarebbero 66 milioni, secondo quanto dichiarato dallo stesso giornale. Questo lo renderebbe la terza fonte di contenuti dopo Wikipedia e il database dei brevetti americani. 

I proprietari di ChatGPT hanno risposto che la loro azienda sostiene il giornalismo, non lo danneggia. L’accusa del New York Times sarebbe senza fondamento perché l’addestramento ricadrebbe nel fair use, i fenomeni di “rigurgito” sono rari e si sta lavorando per ridurli a zero e la società collabora con giornali e agenzie stampa per creare nuove opportunità.

Inoltre, OpenAi sostiene che il celebre giornale “non sta dicendo tutta la verità”. Fra i due colossi americani, aziende che valgono miliardi, era in corso una trattativa per l’acquisto dei contenuti prodotti dal New York Times, così da superare il problema del diritto d’autore. La denuncia sarebbe stata un fulmine a ciel sereno, senza motivazioni valide. 

Nel frattempo, alla denuncia si sono uniti altri otto giornali americani di primo piano: il “Chicago Tribune” e il “Denver Post”,il “New York Daily News”, l’”Orlando Sentinel”, il “Sun Sentinel of Florida”, il “San Jose Mercury News”, l’”Orange County Register” e il “St. Paul Pioneer Press”.

Chi ha accettato e collabora con le IA

Sembra proprio che la strategia perseguita da OpenAi sia quella di acquistare i contenuti che le servono. Gli investimenti di milioni di dollari fanno capire quanto essi siano essenziali ai sistemi di intelligenza generativa per funzionare correttamente. 

Le cifre degli accordi tra l’azienda americana e varie testate giornalistiche, sparse in tutto il mondo, sono state rese note solo raramente. È certo però che il mondo dell’informazione si stia spaccando fra chi si oppone a OpenAi e chi ha deciso di collaborarvi, vendendo gli articoli prodotti da giornalisti professionisti in cambio di consistenti cifre mensili. 

Questo secondo schieramento è sempre più numeroso. Di recente anche News Corps, il gruppo di Rupert Murdoch, ha ceduto per una cifra di 250 milioni i suoi contenuti e l’accesso al suo archivio per i prossimi cinque anni. Questo significa che ChatGPT avrà accesso alle testate “News corp Australia”, “News UK” e soprattutto il “Wall Street Journal”.

Rupert Murdoch, tra i primi ad accettare le offerte di OpenAi

Un altro celebre gruppo che ha accettato l’offerta di OpenAi è “Axel Springer”, che possiede numerosi giornali di tutto il mondo, più di 200 brand in tutto. ChatGPT accederà così ai contenuti di “Politico”, “Businnes Insider”, “Bild”, “Welt”. 

Il CEO di Axel Springer, Mathias Dopfner, ha dichiarato che “Siamo entusiasti di questa partner mondiale con OpenAi, la prima del suo genere. Vogliamo esplorare le opportunità della collaborazione tra giornalismo e intelligenza artificiale per portare qualità, rilevanza e  modello di business del giornalismo a un nuovo livello”.

Anche in Francia c’è chi si unisce a ChatGPT: Le Monde, tra i più importanti giornali d’oltralpe, cederà l’accesso al suo archivio all’intelligenza artificiale californiana. L’adesione cha ha fatto più rumore nell’ultimo periodo, però, è quella del “Financial Times”, il quotidiano britannico considerato il re indiscusso dell’informazione finanziaria. 

La partnership prevede che gli utenti del chatbot potranno vedere riassunti, citazioni e link attribuiti ai giornalisti del Financial Times in risposta alle loro domande. In cambio, OpenAI coinvolgerà l’azienda giornalistica nello sviluppo di nuovi prodotti di intelligenza artificiale.

L’IA dai giochi da tavolo all’informazione

Dopo gli scacchi e il go, sembra che l’intelligenza artificiale si stia allargando anche al mondo dell’informazione. Per farlo, ha bisogno di fare esperienza. Se è stato facile appropriarsi delle migliori mosse dei giocatori di go, accedere a contenuti giornalistici di qualità si sta dimostrano più ostico. 

Le conseguenze di questo braccio di ferro tra giornalisti e chatbot avrà pesanti ripercussioni sul mondo dell’informazione che conosciamo oggi. Di conseguenza, lo avrà sul modo che abbiamo di vedere il mondo. L’impatto sulla qualità del giornalismo, la sostenibilità del business delle informazioni e il modo in cui fruiremo delle notizie è ad oggi imponderabile. Il lavoro del singolo giornalista, con le sue fonti, i suoi contatti e la sua deontologia dovrà essere ripensato nella sua interezza.

Nel suo “Mercanti di verità”, Jill Abramson racconta la sua esperienza nel mondo del giornalismo e come questo mondo si sia evoluto negli ultimi decenni. Poco conosciuta al pubblico italiano, è stata la prima direttrice donna del New York Times. 

In conclusione della sua opera scrive: “in frangenti pericolosi come quelli che stiamo vivendo, i giornalisti e il giornalismo sono più preziosi e vitali che mai per la società. Se questo libro servirà a rafforzare e sostenere il lavoro di coloro che attualmente svolgono la professione o ad ispirare una nuova generazione a seguire il loro esempio, avrà raggiunto il suo scopo”.

Bisognerà capire come si potrà mantenere il giornalismo nell’era dell’intelligenza artificiale. Abramson, però, sembra sicura sul futuro della professione: “L’intelligenza artificiale non fa scoop e un algoritmo non sarà mai un reporter” ha dichiarato di recente. La storia potrebbe darle ragione. 

Foto in evidenza: https://denstoredanske.lex.dk/OpenAI; Foto nell’articolo: 1) https://commons.wikimedia.org/wiki/File:OpenAI_logo_with_magnifying_glass_%2852916339167%29.jpg 2) https://commons.wikimedia.org/w/index.php search=new+york+times&title=Special:MediaSearch&go=Go&type=image 3) https://commons.wikimedia.org/wiki/File:Rupert_Murdoch_22962005304.jpg

La newsletter di Aliseo

Ogni domenica sulla tua mail, un'analisi di geopolitica e le principali notizie sulla politica estera italiana: iscriviti e ricevi in regalo un eBook di Aliseo

Lorenzo Della Peruta

Lorenzo Della Peruta

Dello stesso autore

In evidenza

Aliseo sui social