Nuovo ordinamento mining (soluzione).

Non ho tempo di farvi il grafico io perche’ sono al lavoro, ma posso darvi la spiegazione del test precedente e del perche’ la costruzione di buoni strumenti e la capacita’ di effettuare misure affidabili sia materia di studi che possono durare una vita, e un tecnico di laboratorio , per il solo fatto di saper fare misure, sia una professionalita’ preziosissima.
In breve:
  1. Vi ho dato la sensibilita‘ dello strumento, ma NON la sua precisione. , ne’ la varianza delle misure. In conformita’ al principio di Occam, si dovra’ assumere lo scenario peggiore.
  2. Vi ho fornito valori medi, ma non ho mai detto (non avendo, del resto,  specificato la precisione) che tutti i valori misurati stiano nello stesso intervallo di graduazione dello strumento nel quale cade il valore medio.
Mi piacerebbe che arrivaste da soli alla soluzione, cercando di visualizzare nel seguente modo i dati ottenuti col programma che preferite (qui c’e’ un’immagine di gnuplot) . Anche la visualizzazione scientifica NON e’ una materia semplice (faccio notare che non menzionando i dati rilevati NON ho posto problemi di data mining, quindi smettetela di fare data mining, non avete dati).

style8a

Questo e’ circa il lavoro che veniva richiesto all’ IPCC nello stimare le medie di misure della temperatura prive di decimali affidabili, assumendo una sensibilita’ di solo un grado.(1)

I risultati delle misure sull’uccello dello scienziato , ovviamente, si spiegano da soli.

Complimenti a quelli che ci hanno preso, comunque.

UPDATE: rieccomi a casa. Vediamo di spiegare cosa intendo.

  • E’ alta 164 cm. Non puo’ essere, in metrologia il dato vero e’ inconoscibile.
  • E’ alta tra i 214 cm e i 114 cm. In caso di errore di sensibilita’ S , se si presume che l’errore sia casuale si fa ± S/2,( JCGM 200:2008, International vocabulary of metrology — Basic and general concepts and associated terms (VIM). Paris : JCGM, 2007) quindi stiamo maggiorando . Questa soluzione e’ l’unica formalmente accettabile perche’ ha un margine di incertezza simmetrico e non ci costringe a dire che abbiamo errori sistematici che non possiamo supporre senza ipotizzare a sbafo, e sicuramente maggiora l’errore, rendendola quella piu’ accettabile sotto il profilo del metodo: perdiamo informazione, dove tutte le altre risposte ne aggiungono violando Occam. Maggiorare il margine di errore e’ controproducente ma NON e’ scorretto , squilibrarlo con intervalli di incertezza asimmetrici in questo caso si’ perche’ non abbiamo una teoria dello strumento.
  • E’ alta tra i 164 cm e i 214 cm Il margine di incertezza non e’ simmetrico, e non abbiamo dati per dire che ci siano fenomeni o errori sistematici.
  • E’ alta tra 150 cm e 175 cm Il margine di incertezza non e’ simmetrico, e non abbiamo dati per dire che ci siano fenomeni o errori sistematici.
  • E’ alta tra 150 cm e 200 cm Il margine di incertezza non e’ simmetrico, e non abbiamo dati per dire che ci siano fenomeni o errori sistematici.
  • E’ alta tra 175 cm e 200 cm Il risultato e’ fuori dall’intervallo.

E ancora:

  1. La sua assistente e’ cresciuta di due cm.Non puo’ essere, in metrologia il dato vero e’ inconoscibile.
  2. La sua assistente e’ piu’ alta ma non sa di quanto. Abbiamo un dato significativo, ma l’errore lo offusca.
  3. La sua assistente e’ alta quanto l’anno prima. Non ci sono elementi per affermare un’uguaglianza esatta, e la media differente indica una crescita.
  4. La sua assistente e’ alta quanto l’anno prima o forse no. La misura e’ stata eseguita e ha dato risultati.
  5. La sua assistente ha di certo cambiato altezza ma non e’ possibile sapere la nuova altezza. “Cambiato altezza” non e’ una misura quantitativa.

Andiamo alla misura del pene:

  1. Di averlo lungo 17 cm. La media ottenuta e’ inferiore alla sensibilita’, il numero non e’ una misura.
  2. Di averlo lungo tra 0 e 50 cm. Corretto: la media ottenuta e’ inferiore alla sensibilita’, si usa la sensibilita’.
  3. Di averlo lungo tra 0 e 67 cm. Margine di incertezza non simmetrico.
  4. Di averlo lungo tra 17 e 67 cm. Margine di incertezza non simmetrico.

E ancora:

  1. La cura ha funzionato. Impossibile stabilirlo, sia il valore della misura che la variazione sono sotto la sensibilita’.
  2. La cura ha funzionato oppure no. Corretto: non possiamo saperlo.
  3. La cura ha funzionato ma non sa quanto. Impossibile stabilirlo, sia il valore della misura che la variazione sono sotto la sensibilita’.
  4. La cura non ha funzionato.Impossibile stabilirlo, sia il valore della misura che la variazione sono sotto la sensibilita’.
Perche’ ho detto che 50 sia la sensibilita’ dello strumento? Perche’ non ho i mezzi per escludere la peggiore delle ipotesi, cioe’ che lo strumento proceda per valori di soglia come alcuni strumenti digitali, e per via di Occam devo scegliere l’ipotesi che mi fornisce MENO informazioni. Mi ha stupito vedere tutti dire che 164 stia tra 150 e 200: l’intervallo di incertezza (a meno di informazioni che non abbiamo ) deve essere simmetrico. Certo, se usiamo un telescopio e sappiamo che il vetro cambi qualcosa in una direzione allora si’, possiamo ipotizzare un fenomeno sistematico, ma nel nostro caso abbiamo detto che NON sappiamo come diamine vengano aggiustati i valori misurati (che, btw, potrebbero soffire di errori a prescindere dalla sensibilita’).
Il problema ovviamente cambia molto se misuriamo 164 ± 50  oppure 17 ± 50 , 164 ± 25  oppure 17 ± 25 , visto che l’insieme delle incertezze ha la misura del misurando, in un caso facciamo una misura (anche se molto scadente), nel secondo caso NON facciamo proprio nulla. Posso supporre una certa disistima verso i fisici, ma supporre un 17 centimetri con un errore sistematico in eccesso oppure lunghezze negative del loro pene mi sembra offensivo. 🙂
Prima che tutti vengano a raccogliere la sfida a chi ce l’ha piu’ lungo, siccome NON era mia intenzione fare una megalorcheomachia, scrivo un post per spiegare il senso di questa operazione blogghesca in relazione al lavoro dell’ IPCC, che dovrebbe farci riflettere.

Uriel

(1) In realta’, se in occidente si misurava la temperatura in maniera accurata gia’ nel 1880, nel resto del mondo le misure erano fatte da topografi erranti, spesso a cavallo, che annotavano solo la temperatura , le coordinate prese col sestante, e alcuni dati imprecisi sul sulle condizioni metereologiche, e la data. Se si trovavano dal lato sbagliato di una valle, se erano dentro una foresta (e quindi all’ombra) . Capite che se io misuro le temperature il 2 febbraio del 2010 e del 2011, in condizioni metereologiche diverse, senza una scienza metereologica che mi permetta di descriverle adeguatamente e di capire quanto della temperatura sia dovuto al vento o meno, assumere un solo grado di sensibilita’ (la media dei termometri portatili dell’epoca) sia gia’ un regalo.  Sull’uso e la selezione di questi dati e’ nata la discussione che ha poi  riguardato le email rubate e pubblicate. Provate, se avete gnuplot, a riscrivere il grafico dell’ IPCC usando lo stile (con gli intervalli di incertezza) che ho postato sopra, e assumendo un intervallo di un grado.

Instrumental_Temperature_Record