Di parastatistiche seccanti.

Di parastatistiche seccanti.

Non so se lo avete notato, ma le facolta’ scientifiche non usano la parola “scienza” nel proprio nome. Fisica si chiama “Facolta’ di Fisica”, non “Scienza fisica”. La facolta’ di chimica si chiama “Facolta’ di CHimica”, non “di scienza chimica”. Ingegneria forse aveva la parola “scienza dell’ingegneria” solo in alcune facolta’ antiche, ma ora l’hanno abolita.

Stranamente, a prendersi la parola “scienze” sono le facolta’ meno scientifiche. Scienze della comunicazione, scienze sociali, scienze dell’educazione, eccetera.

Forse e’ questo che li ispira ad usare metodi che sembrano scientifici, o che vengono dalla scienza, con risultati che stanno cominciando a diventare imbarazzanti, specialmente quando si parla di statistica.

Sia chiaro, le tecniche in uso sono corrette: il problema e’ che un falegname molto esperto, applicando tecniche correttissime, ha poche probabilita’ di riparare la scheda madre di un computer. Un sintomo di questa cosa e’ l’utilzzo, se non l’abuso, della normalizzazione e delle correlazioni, nei problemi multifattoriali.

Il piu’ noioso e’ sicuramente il dato sul “gender gap”.

Allora, stiamo parlando di reddito. Quali sono i fattori che concorrono alla formazione del reddito? A sentire chi parla di gender gap, il fattore principale e’ il genere, dal momento che la loro “misura” ha senso SOLTANTO in questo caso.

Il problema e’ che , in Italia, la formazione del reddito dipende, in ordine decrescente, dai seguenti fattori:

  • Scolarizzazione (il semplice titolo di studio, insomma)
  • Specializzazione (in quale settore lavori)
  • Localita’ geografica (al nord gli stipendi sono piu’ alti)
  • Famiglia di provenienza (genitori apripista, insomma)
  • Genere sessuale
  • Salute (gli handicappati hanno problemi)
  • Aspetto fisico.

Questa specie di gerarchia non fa altro che calcolare, in definitiva, quanto sia importante un determinato fattore. E a quel punto, si costruisce un albero decisionale, o un dicotomizzatore, o un ID5, e si possono fare considerazioni interessanti. Questo NON significa che il genere non conti: ma non e’ un predittore.

Ovviamente adesso arriva il genio imparato e mi dice “ma noi abbiamo fatto i conti a parita’ di tutti gli altri fattori”, un modo bovino per dire “abbiamo normalizzato”. E sia chiaro: normalizzare, destagionalizzare sono procedure lecite e consentite. Ma se lo fate in un problema multifattoriale , su fattori che pesano pio’ del vostro, c’e’ un piccolo problemino di ordine scientifico. Cosa significa?

Significa che se vi dico:

  • X ha un dottorato in economia, si occupa di alta finanza, vive al Nord, viene da una famiglia ricca
  • Y ha la quinta elementare, lavora nel campo delle pulizie domestiche, vive al Sud, viene da una famiglia povera

voi riuscite a “prevedere” che il reddito di X sia piu’ alto. Se invece io vi dico:

  • H e’ una donna.
  • K e’ un uomo.

solo con questi due dati , non riuscite a dirmi chi sia piu’ ricco dei due.

Cosa succede allora? Succede che i fattori piu’ pesanti sono dei predittori molto migliori. E quindi, se anche normalizzate (bravo! bravo!) , ottenete solo che la vostra prevalenza NON vi dice quello che volete dica: per dire quello che volete dica, servirebbe che il genere sessuale fosse il PRIMO tra i predittori del reddito.

E non solo fate questo: vi state negando la possibilita’ di immaginare le soluzioni. Se fate l’analisi arrivando alla conclusione che le donne guadagnino meno (ma avete normalizzato! fucina di eroi!) , l’unica cosa che potete fare e’ una legge che alza gli stipendi. Ma non avete sfiorato il problema neppure di striscio: quella gerarchia di predittori mi dice che la soluzione consiste non solo nello scolarizzare le donne, ma nello specializzare le donne: devono studiare, e devono studiare le cose giuste che portano a stipendi alti.

Sto dicendo che non esiste alcun gender gap? No. Sto dicendo che dipende principalmente da altri fattori, che in qualche modo entrano in relazione col genere sessuale.

E’, appunto, una questione multifattoriale.


Un’altra analisi di questo tipo e’ quella che riguarda il problema immaginario delle persone transessuali nello sport. DIco problema immaginario perche’, se prendiamo il numero di campionesse olimpiche che sono transessuali, la risposta e’ che succede ZERO volte. Se andiamo alle campionesse nazionali che sono transessuali, sul podio ne troviamo ancora ZERO.

Un fenomeno che non succede , non e’ un fenomeno. E’ una fantasia.

Ma supponiamo pure che il mondo sia pieno di transessuali che vogliono giocare contro le donne. Quali sono i predittori di successo nello sport? Dipende dallo sport.

In alcuni sport l’altezza e’ molto piu’ rilevante del genere sessuale. LA pallacanestro. In alcuni sport essere africani di alcune zone e’ un vantaggio, perche’ le gambe sono mediamente piu’ lunghe. In altri sport olimici, come il pattinaggio artistico, il genere e’ quasi irrilevante rispetto alla performance.

Se riduciamo tutto ad un fattore e facciamo dello sport un qualcosa di monofattoriale, possiamo affermare che le transessuali siano sempre avvantaggiate? Uhm..

Di parastatistiche seccanti.
Questa persona transessuale (Alex Tilinca), alla nascita , era classificata “femmina”

Allora, fareste gareggiare Alex Tilinca contro le donne perche’ ha la vagina e i cromosomi XX? La risposta e’ ovvia: dipende. Sarebbe avvantaggiato nel lancio del disco, probabilmente, ma a quanto vedo dalle altre foto e’ troppo basso per la pallacanestro. Non so dirvi come sia sui pattini, ma di sicuro nella lotta grecoromana sarebbe avvantaggiato.

Ma se pensate di no e vi chiedete “perche’ no” la risposta e’ che considerate i muscoli piu’ importanti del sesso , nella possibilita’ di vincere una gara. Se credeste che sia importante il sesso biologico, non chiedereste ad Alex di gareggiare con gli uomini.

Il fatto che ci siano caratteristiche fisiche piu’ importanti del genere, nel mondo olimpico, significa che ci stiamo ponendo il problema sbagliato. Dovremmo usare , invece che maschi/femmine, un indice di forza muscolare per fare le categorie.

E… abbiamo gia’ parlato del fattore eta’, vero?

Voglio dire, alla fine noi separiamo uomini e donne perche’ pensiamo che gli uomini siano avvantaggiati, ma non cacciamo via quelli che si presentano ad ua gara di corsa ad ostacoli con una gamba altissima , come fanno gli atleti africani: la lunghezza della gamba in proporzione al corpo pesa piu’ del genere, o comunque pesa: vogliamo dividere gli africani dagli altri? Faremo un campionato solo per i cinesi? Eppure , la differenza media  di prestazioni tra africani e cinesi, nella corsa,  e’ ancora maggiore di quella tra maschi e femmine.


Questa tendenza a prendere problemi multifattoriali e ridurli ad un solo fattore e’ noiosa. Semplicemente, mi annoia veder fare sempre lo stesso erore.

Tutto cio’ che dipende da piu’ fattori NON puo’ essere analizzato riducendolo ad uno solo. Nemmeno se normalizzate. Esistono i decision tree, esiste il clustering, e tante altre cose.

Punto.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *