Societa’ stocastiche

Nel post precedente, come al solito, ho usato termini che credevo essere compresi. Al contrario, ai piu’ la sostanza di quei termini e di quei discorsi sfugge. Cosi’, nei commenti ho letto le cose piu’ disparate, frutto di un addestramento a pensare per riflesso condizionato ad alcune cose , a comando. Cosi’, alcuni hanno risposto come se io parlassi di privacy, altri hanno risposto come se io parlassi di intercettazioni, altri hanno risposto come se io parlassi di psicologia. Cosi’, adesso faccio un bel post di “disambigua”, come dicono quelli di Wikipedia.

La statistica. La statistica, che mi crediate o meno, e’ una scienza esatta. Chi pensa che la statistica sia “fare la media”  semplicemente e’ un umanista incompetente. Con la statistica posso calcolare integrali, per esempio usando un metodo di Montecarlo, e vi posso garantire che in moltissime dell delle ipotesi (esistono molte tecniche per ottimizzarlo) avra’ una convergenza di secondo ordine. Significa che se voglio raddoppiare la precisione devo quadruplicare il numero di campioni, tutto qui. Non e’ buono, ma per funzioni veramente ostili funziona molto bene.

Un esempio? Uscendo da Montecarlo, nella IIWW i tedeschi avevano l’abitudine di immatricolare i carri armati usando un numero progressivo (1,2,3…100,101,102, … etc). Gli inglesi catturarono una ventina di carri  in date diverse e battaglie diverse e si impadronirono  dei numeri di matricola. Li diedero a dei matematici, i quali stimarono cosi’ la capacita’ produttiva dell’industria tedesca. Sbagliarono di una decina di esemplari l’anno.

Morale: gli inglesi riuscirono a dare priorita’ PRECISE ai bombardamenti aerei, togliendo i nuovi carri ai tedeschi in breve tempo. http://en.wikipedia.org/wiki/German_tank_problem (Grazie a Yossarian per il Link)

Ma un “processo stocastico” e’ qualcosa di piu’. E’ un discorso sulla statistica: per gli umanisti, e’ una metastatistica. Si tratta cioe’ di metodi coi quali si possono modellizzare attraverso la statistica dei fenomeni fisici reali. Spiegarlo ai profani e’ difficile , cosi’ per favore gli esperti si voltino altrove, perche’ devo usare dei paragoni molto intuitivi.

Supponiamo che dell’acqua cada dentro un contenitore ad un certo ritmo. Si tratta ovviamente di un problema deterministico (se conosciamo il flusso), e se vogliamo sapere come aumenti la quantita’ di acqua che possiamo definire con una normale equazione del tipo

Qt = Q0 + F * (t1 – t0)

Ho scritto che se in un certo momento io ho Q0 acqua, e apro un flusso F litri al secondo , dopo un tempo (t0 – t1) avro’ piu’ acqua.

Posso scriverlo anche come

Qt – Q0 = F * (t1 – t0)

e quindi dire che

ΔQ = F * Δt

e andando avanti

dQ = F dt

finendo con l’ovvieta’, ovvero che

dQ/dt = F

Questo e’ un approccio cosiddetto “deterministico”. Potete calcolare, esattamente, quanta acqua ci sara’ dentro la bottiglia.

Esattamente.

Posso pero’ avere un approccio stocastico.  Come?

Posso scrivere un processo di Ornstein : se considero stocastico un sistema del genere, ma diciamo che ho a che fare con un fiume che ha una quantita’ media annua ma ha oscillazioni con le piogge, e che devo fare una diga, posso scrivere che:

dSt = – St dt + dWt

Che cosa ho scritto in questo modo? Ho scritto qualcosa come “litro piu’ litro meno (dWt ), piu’ passa il tempo, piu’ si riempie (dSt = – St dt)”

Ora, il punto e’: dal momento che sappiamo che si riempie col tempo e -guarda caso- la parte in S sara’ uguale a quella sopra, come mai c’e’ una parte  dWt ? E specialmente, quanto vale? Quanti litri sono + dWt , di preciso?

La risposta e’: “salamadonna”. Ma e’ un “salamadonna matematico”, quindi finira’ con essere un numero.

Allora, siccome non sappiamo quanto sia  dWt possiamo pensare di tirare a casaccio con una moneta: se esce testa togliamo un litro, se esce croce lo aggiungiamo. Ovviamente, per tempi molto lunghi sappiamo gia’ come finira’. E cioe’ che la parte dWt  scompare, perche’ con tante prove le volte in cui esce testa e le volte in cui esce croce si equivalgono. E quindi rimane la regola che conosciamo tutti. “Salamadonna”, in molto tempo, e’ uguale a zero.

Che senso ha allora un sistema stocastico? Sta nel fatto che sappiamo come maneggiare matematicamente un oggetto fatto cosi’ ( dSt = – St dt + dWt ) anche senza sapere di preciso cosa sia W e che cosa sia S. 

Insomma, quando i tecnici parlano di processi stocastici , intendono la possibilita’ di maneggiare tranquillamente dei sistemi nei quali una parte (o tutto) di quel che succede e’ casuale. Ottenendo, pero’, dei risultati che possono venire usati per fare predizioni.

E’ piu’ preciso un sistema stocastico o l’approccio “normale”. A prima vista, si direbbe l’approccio “normale”. Il guaio e’ che non esiste il rubinetto perfetto: e se per caso l’acqua del vostro rubinetto “in media” arriva in un certo modo, ma a volte e’ piu’ forte ed a volte piu’ debole, diciamo che e’ un fiume che varia a seconda delle piogge con una media annuale abbastanza stabile, potreste voler usare un processo stocastico per la vostra diga. 

Esistono molti tipi di processi stocastici oltre a quello di Ornstein, e la scrittura che ne ho fatto e’ MOLTO semplificata (e’ quasi irriconoscibile come tale, dal momento che ho tolto le parti legate all’attrito per cui e’ nata la formula di Ornstein) per quadrare dentro un discorso per profani, ma tant’e’, di sistemi stocastici de ne sono a iosa: alcuni si applicano nella meccanica dei gas e dei liquidi, altri nel caso di rischio di incidente, insomma ce n’e’ per tutti i gusti.

Se vi ha incuriositi, potete iniziare qui: http://en.wikipedia.org/wiki/Ornstein%E2%80%93Uhlenbeck_process

Sia chiaro che siete voi a scegliere che diamine di sistema usare: il processo che ho usato togliendo alcuni valori e’ buono se calcolate il moto di un tizio alla stazione di milano, se il cammino e’ ostacolato da tutta la gente che incrocia (la folla che vi ostacola). Mutilato cosi’, poteva andare solo in questi casi. Ma per divulgar -o provarci- bisogna soffrire un pochino.

Allora adesso andiamo al discorso che ho fatto su Facebook.

Innanzitutto, ho parlato di sociologia e non di psicologia. Significa che a chi vuole un modello stocastico della societa’ interessa conoscere la societa’ nel suo insieme e non il singolo. Perche’? Perche’ e’ l’approccio utile: quando bollite la pasta, voi bollite “la pasta”. Se volete sapere che diamine di tempo occorra per la cottura , non vi interessa calcolare in che stato sara’ il singolo maccherone.

Tuttavia, vedere un singolo maccherone che si annerisce e carbonizza puo’ suggerirvi di aggiungere acqua per bollire la pasta, quindi contemporaneamente osservare il singolo maccherone PUO’ esservi utile. Ma non perche’ ve ne freghi qualcosa, bensi’ perche’ e’ sintomatico dello stato generale. Se infatti un maccherone si sta carbonizzando, piu’ o meno (ricordate il processo stocastico di cui sopra?) i maccheroni tutti sono in pericolo.

Se invece interessasse il singolo e si volesse usare Facebook per farsi un modello della psicologia umana (possibile, con quel numero di dati) allora non useremmo affatto i sistemi stocastici, e inizieremmo a costruire un modello deterministico (probabilmente una macchina a stati e stack) di persona. Ma e’ una cosa diversa, infatti io ho parlato di sociologia (studio della societa’) e non di psicologia (studio della psiche). (1)

Molti allora si sono messi  rispondere con la storia della privacy. Vi sentite importanti, speciali , dei pezzi unici e rari. Cosi’ pensate davvero che le aziende vi stiano spiando per sapere cosa spendete, al preciso scopo di personalizzarvi l’offerta.

Ora, se ci rifletteste un pochino vi chiedereste : “quanto spazio percorro per comprare le cose che compro?”. La risposta e’ che mediamente trovate il 90% di quel che comprate nella vostra citta’. Cosi’, signori, se foste dotati di logica avreste notato che al 90% non siete diversi dagli altri cittadini della vostra citta’. Se anche foste unici in citta’ a comprare la cosa X in quel negozio, il negozio chiuderebbe, oppure la pagate una fortuna.

I vostri consumi sono contenuti in un intervallo che ha,  per oltre il 90%, tutto in comune con chiunque altro. Non siete importanti, non siete speciali, non siete pezzi unici e rari, non siete fiori che sbocciano ogni cento anni. Siete stronzi qualsiasi. Ed e’ per questo che NESSUNA industria perdera’ MAI il tempo di sapere di preciso che cosa compriate voi come individui.

Alle aziende interessa sapere cosa si vende ad Alessandria, non cosa si vende a Beppe Rossi di Alessandria. Nessuna malvagia azienda, quindi, vi sta spiando per profilarvi. Spiacente per il vostro edonismo: ogni scarrafone e’ bello a  mamma sua, ma da un certo punto di vista si osserva solo una famiglia di scarrafoni indistinguibili tra loro: voi e mamma. Quella cosa che avete “solo voi”, che in realta’ avete solo voi tra i vostri 30 amici (di cui 29 colleghi – il che restringe lo spazio sociale) e’ stata prodotta in milioni di copie. Siete uno dei tanti ad avere una cosa “solo voi”.  (E no, gli amici immaginari non contano, anche se vi chiedono di sacrificare vostro figlio Isacco.)

Cosi’, quando intendo “creiamo un processo stocastico” che permetta di prevedere la societa’, intendo un modello stocastico nel quale la percentuale “casuale” diventa sempre piu’ piccola mano a mano che si allungano i tempi E aumenta il numero  persone, e/o diventa piccola perche’ maneggiamo le formule per farla scomparire in qualche modo.

Quindi si, alcuni modelli stocastici somigliano proprio alla psicostoria di Asimov. Con la differenza che sinora nessuno ci ha mai provato. Perche’?

Perche’ in ultima analisi la cosa che occorre per costruire una teoria scientifica e’ una prima osservazione del fenomeno. Ma sinora, osservare una societa’ non era praticamente possibile. Si, alcuni sociologi hanno tentato di scrivere delle equazioni, ma sfortunatamente si sono sempre fermati quando si e’ chiesto loro il fondamento scientifico, ovvero la parte “sperimentale” della cosa.

Non solo non hanno mai potuto definire delle metriche e delle dimensioni vere, ma non sono riusciti a realizzare quello che in fisica si chiama misura. Si, fanno sondaggi: ma chiedere a qualcuno “mangi molto” non e’ come misurare che cosa mangi.

Voglio dire, prendiamo come fanno la carbonara in Germania: la Maggi vende ai tedeschi una “carbonara” fatta con panna, uovo, prezzemolo e prosciutto cotto a tocchetti. Se interrogassi un milione di tedeschi sulla carbonara -che credono essere quella- riguardo alla “soddisfazione del cliente” , per misurare la bonta’ del prodotto Maggi, otterrei che e’ buono. Ovvero che i clienti sono soddisfatti.

Chiediamoci: in Germania si mangia una buona carbonara?

Ora, possiamo investigare quanto vogliamo sulla qualita’ del prodotto Maggi e su cosa sia la “Soddisfazione del cliente”. Ma se la domanda “facciamo una buona carbonara” la associamo a “guanciale, pecorino romano, cremosita’ dell’uovo, maccheroni, pepe”, immediatamente scopriamo che in Germania si parla invece di “prezzemolo, panna, spaghetti, prosciutto cotto” quando si parla di Carbonara. Ovvero, che si mangia una PESSIMA carbonara.

Screenshot at 2012-03-01 23:01:49
Io lo so, che non ci credete. Guardate il prezzemolo dietro il piatto, leggete (nella banda blu) la parola Sahne, panna.

Cosi’, questa e’ la proporzione tra quello che fa il sociologo intervistando/osservando persone e la misura e’ questa: si pota via l’opinione.

Cosi’, con una base dati come quella di Facebook e’ possibile determinare DAVVERO una misura. Posso cercare carbonara sul Facebook tedesco e vedere quante volte appare con “petersilie” e “sahne” e quante volte no.   E cosi’, ANCHE se i tedeschi diranno che  al ristorante mangiano una buona carbonara, noi possiamo dire “no”. Ovvero, astrarci dalle opinioni.

Riguardo alla presenza del contesto nella grammatica, potrebbe interessarvi questo: http://it.wikipedia.org/wiki/Gerarchia_di_Chomsky (ovvero, quando Chomsky scriveva cose sensate).

Per questo motivo i social network rappresentano una svolta per la sociologia: per la prima volta c’e’ una base di dati SCIENTIFICA. Si puo’ fare LA MISURA.

Questo pero’ e’ un requisito NECESSARIO alla scienza, ma non sufficiente. Ovviamente occorre che qualcuno sviluppi i modelli, li confronti con la realta’ sperimentale, e veda se effettivamente sono predittivi. Se qualcuno lo ha fatto, non ce lo ha detto. Esistono molte tecniche del marketing che lo fanno per scopi commerciali, ma quelle avevano GIA’ dei dati sperimentali OTTIMI, ovvero le vendite.

Si tratta ora di applicare teorie con scopi simili ad altri problemi, che sono quelli tipici dei sociologi.

Cosa ce ne facciamo di un modello di tipo stocastico di societa’? Come ho detto, i cinesi possono prevedere se ci saranno rivolte, quali siano le zone con piu’ alta probabilita’ di rivolta, eccetera. E’ possibile, come nel caso dei No Tav, prevedere che tali rivolte NON diventeranno MAI rivoluzioni e quindi intervenire SOLO per i fenomeni che lo diventeranno dando cosi’ un’impressione di democrazia (lascio manifestare quelli innocui) quando poi non e’ vero (perche’ quei 2-3 al secolo che sono pericolosi li casso con una scusa.

E’ possibile nascondere un fenomeno? No. Qualcuno ha detto “ma la mafia usa i pizzini”. Vero. Ma tutti gli altri no. Negozianti che subiscono usura, persone che ne vedono i risultati, aziende che perdono i concorsi, una distorsione della societa’ si notera’ COMUNQUE, nel momento in cui alcune parole in una societa’ distorta saranno piu’ comuni del solito, ed altre no. Io immagino tecniche di calcolo dell’entropia o di pattern matching, ma suppongo che molti saranno gia’ li’ ad immaginare trasformate di fourier e analisi di spettro. Ognuno ha i propri gusti: in ogni caso, se cambia un tessuto sociale cambiera’ tutto, e quindi sara’ possibile misurarlo. A patt di avere i dati.

Anche Bin Laden usava metodi assurdi. Ma le societa’ che hanno prodotto Al Qaeda non erano identiche alle altre. La gente fara’ discorsi diversi dagli altri. Quindi, se troviamo un pattern, possiamo poi identificare quali sottogruppi (anche tra gli immigrati) possano produrre dei fenomeni come l’integralismo. Occorre pero’ avere chiari i pattern da cercare.

Chiaro che occorra una serie di misure per calcolare quali. Finora e’ stato impossibile: quel poveretto di Miller ha cercato di teorizzare una psicologia fatta di vettori analoghi alle forze. Giusto, se vi piace quell’approccio: mediante l’analisi dimensionale potreste anche trovare analogie simili. Ma senza strumenti di misura, ci fate poco.

Oggi li hanno.

In ultimo alcune considerazioni su domande fatte.

Io gestisco (in questo progetto) uno dei tanti sistemi al mondo che fanno da Hub per mms/SMS. Ne esistono tanti come quello di  http://www.wds.co  ,  che si occupano di grandi quantita’ di messaggi  via IP, che sarebbero altrimenti costosissime sui link normali.

Il numero di SMS per ogni flusso nazionale, la loro lunghezza o la loro latenza e’ per me un KPI, cioe’ un indicatore della bonta’ del servizio. Inoltre, la gestione delle code e’ fondamentale per questioni di capacita’ dei sistemi. Quindi, il fatto che io abbia dei grafici che mi segnalano che su una certa nazione gli SMS di Facebook sono in crescita non e’ legato ad attivita’ di spionaggio. E’ legato alla manutenzione dei sistemi.

Posso a volte intercettare qualcosa, ma mi occorre un ticket (un problema grave) documentato, devo chiedere permessi e la cosa viene registrata. Non puo’ accadere spesso.

La mia affermazione su Sanremo e’ corretta. Mi spiego. Se vedete in termini di quantita’ dei messaggi, potete fare dei paragoni. Gli Oscar hanno avuto un certo impatto sull’ Inghilterra, per dire. A 5 minuti dalla fine di un evento qualsiasi, tipo una partita molto importante o una trasmissione TV, io vedo il picco. Non forte come quello per il terremoto , ma lo vedo. Ho visto bene la caduta del governo Berlusconi su twitter per Italia, per dire.

Ovviamente, non potendo misurare il contenuto degli SMS, posso solo vedere in un certo senso l’impatto di qualcosa. Posso vedere se quanto accade invita qualcuno a prendere un cellulare , un computer, un iPad, qualsiasi cosa si colleghi a twitter o facebook, e inviare un messaggio che poi produce una notifica.

Ora, se crediamo che questo indichi un qualche impatto dell’evento, posso dire che Sanremo ha avuto un impatto bassissimo. Se il terremoto del nord italia ha preoccupato un bacino di 30 milioni di persone , invitando chi e’ uso farlo ad informare facebook, posso dire che Sanremo lo vedevano, in proporzione, 150.000 persone si e no. Il terremoto nel nord italia mi ha fatto alzare degli allarmi sulle code, mentre Sanremo ha a malappena creato una lievissima increspatura.

Per intenderci, io queste cose le vedo circa in questa forma:

germania-UK
 Germania-Inghilterra agli scorsi mondiali: vedete i due tempi della partita, paragonati al giorno prima -senza partita-?

Cosi’, posso calcolare che Sanremo abbia causato un traffico quasi irrilevante. Quindi mi spiace, ma paragonato ad altri eventi sociali, Sanremo non sembra impattare il paese. Certo, Auditel dice il contrario, chi sono io per contraddirli? Mettiamola cosi’:  tra i miei dati ed i loro, io preferisco i miei.

Con questo spero di aver chiarito cosa intendevo nel post precedente. Sono un pessimo comunicatore (tantevvero che in media mi serve un secondo post per chiarire il primo), lo so.

Ultima cosa. E’ morto un personaggio grandissimo, che lascia all’Italia un’eredita pesante.Un’eredita’ da portare con orgoglio e da esibire con fierezza. Un modello per tutti noi che siamo all’estero.(2)428769_10150644099360116_377316670115_8981803_982598037_n

E quindi, e’ necessario il “tribute”:404776_318008874914552_100001163267419_808097_426760776_n

Uriel

(1) Non credo nell’esitenza della psiche. In ultima analisi tutto cio’ che osserviamo e’ il comportamento, quindi la psicologia non e’ altro che studio dei comportamenti. Ipotizzando una psiche state andando contro Occam, e come se non bastasse non avete alcuna prova dell’esistenza della psiche come entita’ a se stante, ovvero interamente contenuta in se’ stessa.

(2)I tedeschi imprecano piu’ che bestemmiare.