Pappagalli stocastici, e dove trovarli.

Pappagalli stocastici, e dove trovarli.

Si parla molto degli eretici che hanno costruito Stable Diffusion e GPT-3 , perche’ sono entrati nel gotha di quelli che vi schifavano, guardandovi dall’alto al basso, osando mettere in dubbio il valore dell’artista (non dell’arte) e il valore dello scrittore-creativo (ma non della scrittura o della creativita’).

In loro soccorso arrivano scritti che, cercando l’alleanza accademica con un certo mondo umanistico vanno in soccorso di questi futuri disoccupati, uno dei quali definisce “pappagallo stocastico” quello che fanno queste reti, o i modelli di linguaggio estesi. Siccome nessuno aveva mai dato una reale definizione tecnica o commerciale di “pappagallo stocastico”, possiamo solo leggere il paper e vedere cosa intenda l’autore. 

Il paper fa schifo.  https://dl.acm.org/doi/10.1145/3442188.3445922

Non perche’ dica il falso (non dice nulla che sia falsificabile o che porti qualche dato o fatto)   non  perche’ i numeri siano sbagliati (non ci sono numeri o quantita’ nello scritto) o qualsiasi cosa (lo scritto raccoglie una pila di cazzate woke e parla di rischi che non quantifica e di modelli “troppo grandi” senza definire “troppo”).

Fa schifo perche’ non e’ scienza. E’ il parto di qualche dipartimento di gender studies che lavora in qualche safe zone, ove contraddire chi parla e’ vietato per non urtare i suoi sentimenti.

Il vero problema di quel documento non e’ quello che scrive, che e’ risibile , stupido, superficiale e hollywoodiano: il problema e’ che viene spacciato per scienza solo perche’ e’ un paper.

Non spicca per quello che e’ scritto, ma per quello che NON e’ scritto, ovvero qualsiasi cosa mostri un minimo di pensiero scientifico.


Mi spiego meglio: ChatGPT e’ stato addestrato dandogli in pasto scriti precedenti. Se a chatGPT sono stati dati in pasto solo scritti che erano, a loro modo, scritti da pappagalli stocastici, ovviamente in uscita avremo l’equivalente di tanti pappagalli stocastici:

garbage in, garbage out.

Se per esempio io dessi in pasta l’intera produzione giornalistica di qualsiasi paese, otterrei esattamente la stessa sentenza: pappagalli stocastici. Copiano tutti dalle agenzie, si copiano a vicenda le notizie , gli scritti e i concetti, e nazione su nazione anche il bias si riduce spesso a due posizioni: tradizionalisti/progressisti , destra/sinistra, eccetera.

Lo scritto non si propone di fare questa misura, e al suo posto dice “ehi, quello e’ un pappagallo stocastico ” (sarebbe bello che sapessero cosa significa il termine tecnico stocastico, ma tra gli umanisti e’ di moda usare termini tecnici o scientifici allo scopo di darsi una patina di serieta’ – il che la dice lunga). Peraltro, continuano a confondere GPT con uno stupido markoviano.

Il primo punto che si contesta facilmente di quello scritto e’ l’ammasso di cazzate woke, prive di prove, evidenze, misure. 

Il secondo e’ che nel parlare aggiunge cosi’ tante citazioni da rendere impossibile la peer review, se non da parte di qualcuno che fa peer review positiva perche’ e’ amico del gruppo che scrive quel documento.


Qui siamo al primo punto: se ChatGPT e’ un pappagallo stocastico perche’ “prende contenuti da un gigantesco modello di linguaggio fatto da una quantita’ immensa di scritti”, la definizione si applica perfettamente a quel paper, che “prende contenuti da un gigantesco archivio di contenuti accademicamente accettabili, fatto da una quantita’ immensa di scritti”

Ops. Vista la mole di citazioni in quello scritto, posso tranquillamente dire che chi scrive l’articolo e’ un pappagallo stocastico, alimentato da una quantita’ enorme di citazioni prese da altri scritti. Quello scritto e’, visto il numero di citazioni, il prodotto di un pappagallo stocastico.

Nel dire questo, e a ragion veduta, ovviamente sto toccando un altro gotha della puzza sotto il naso: quello accademico. Perche’ utilizzando il concetto di “stocastic parrot”, scopriamo che per via dell’uso smodato di citazioni praticamente OGNI paper accademico e’ uno stocastic parrot, o un pappagallo stocastico, almeno in gran parte.

Qui arriveranno quelli che mi dicono: a”lt, anche se e’ abbastanza colmo di citazioni di altre opere, il mio paper aggunge qualcosa a quanto si sapeva prima.”

Qui possiamo decidere di credere o meno a questa informazione. Intendo dire che se e’ una scoperta scientifica (le uniche ad aggiungere qualcosa), essa deve contenere un insieme di dati sperimentali che sono necessari alla formulazione e alla dimostrazione della scoperta.

Il guaio e’ che se avete fatto un esperimento, allora l’esperimento NON e’ avvenuto nella vostra mente. Quindi i dati che inserite sono alla stregua di una citazione: state semplicemente citando i dati sperimentali.

Ma se e’ cosi’, allora avete solo aggiunto i dati al vostro modello di linguaggio e siete nuovamente dei pappagalli stocastici.


Qual’e’ la morale di questa storia?

La morale e’ che la non-definizione di pappagallo stocastico usata anche da questo documento  sembra poter riferita ad ogni singolo cervello umano, perche’ e’ cosi’ slabbrata che ci passa qualsiasi cosa.

Liberi tutti? No, non necessariamente. Nel senso che un sistema come ChatGPT ha una cardinalita’ finita perche’ usa una quantita’ finita di esempi. E la cosa buffa e’ che lo stesso sistema, a fare le domande giuste, sembra esserne a conoscenza.

Poiche’ la nostra mente e’ capace di comprendere linguaggi dalla cardinalita’ infinita e di descriverli, mentre ChatGPT ha una cardinalita’ finita, e’ chiaro che esiste ancora una differenza con ChatGPT, ma non ho ancora trovato un solo scritto che puntualizzi questa semplice differenza. (per quanto assiomatizzare non copra o equivalga all’enunciazione di ogni teorema)

In realta’ ChatGPT e’ “ottimista” nella sua risposta (cioe’ sbaglia) , in quanto nemmeno se avesse un linguaggio di potenza infinita potrebbe davvero generare tutte le frasi possibili (Gödel, et al), ma il punto e’ che si tratta dell’unico scritto esistente in rete che si pone la domanda della cardinalita’ e della potenza del modello di linguaggio. E non ne troverete altri.

A quanto pare, ChatGPT e’ un pappagallo stocastico che e’ sotto l’attacco di altri pappagalli stocastici.


Detto questo, adesso gli umanisti si staranno dando di gomito dicendo “hai visto? L’umano e’ superiore”. Nel farlo introducono una fallacia che e’ quella di paragonare il genere umano ai suoi campioni.

Allora, se un campione (umano) di qualche disciplina intellettuale batte un computer , come accadde per gli scacchi (ora non accade piu’ ) si dice che le macchine non potranno mai paragonarsi agli umani. Ma c’e’ un problema, che enuncerei cosi’:

  • “nessun computer sara’ mai come Michelangelo”
  • nemmeno tu sarai mai come Michelangelo, se e’ per questo.

Stabilito, anche per assurdo, che il computer non possa competere con Michelangelo, bisogna stabilire con quante persone possa competere, e con quali. E con quante.

Sono certo che ChatGPT non sara’ mai un giornalista bravo come Enzo Biagi, ma bisogna chiedersi quanti Enzo Biagi ci siano, e quante Sciandivasci ci siano. La Sciandivasci ve la faccio sul cellulare usando un markoviano, se voglio. 

E se per caso basta poco a scrivere meglio della Sciandivasci, bisogna capire che si’, il posto di lavoro di Enzo Biagi e’ salvo (anche perche’ e’ morto), ma su quello della Sciandivasci non scommetterei.

Nondimeno:

Ora, probabilmente i grandi giornalisti su Buzzfeed non sono in pericolo, ma il 12% ha perso il posto quando li hanno sostituiti con ChatGPT.

Allora, il problema e’ semplice: puo’ ChatGPT sostituire un essere umano? No. Ma puo’ sicuramente sostituire subito almeno il 12% dei content creator di Buzzfeed. Le Sciandivasci della situazione, insomma.


E questo, almeno nel giornalismo, pone un problema: quanto del giornalismo moderno ricade nella categoria “pappagalli stocastici”? Beh, possiamo fare un test:

  1. andate sul luogo ove succedono le cose a parlare con le persone, investigare, raccogliere informazioni, a volte correndo dei rischi?
  2. siete tutto il giorno seduti in redazione, il posto piu’ lontano che visitate e’ quello ove andate in villeggiatura, e prendete le notizie “dalle agenzie”?

se la risposta e’ “1” , probabilmente non siete pappagalli stocastici, o almeno siete pappagalli stocastici attivi, nella misura in cui state cercando da soli i dati per il vostro modello.

Se la risposta e’ “2”, siete dei pappagalli stocastici a vostra volta: come se avessimo collegato ChatGPT alle agenzie, e poi gli avessimo detto di scrivere articoli.

I pappagalli stocastici, in poche parole, si trovano nelle sale stampa , nelle universita’ umanistiche, e altri posti. E quando vediamo persone scandalizzate dal fatto che “un computer non sara’ MAI come un creativo”, sappiamo bene cosa sta succedendo: questi abitanti dell’attico della conoscenza vedono un pappagallo stocastico come loro, solo che non si ammala, non sciopera, costa molto meno, e hanno paura che prenda il loro posto.

E accadra’.

https://futurism.com/the-byte/ai-david-cronenberg-movie

La solita, vecchia storia. Come se a scriverla fossero dei pappagalli stocastici.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *