Non volendo andare nei tecnicismi per un post divulgativo, mi limitero’ ad una spegazione di principio, chi vorra’ approfondire ha internet a sua disposizione. Andiamo per gradi: che cos’e’ una CDN, come per esempio Akamai (il backend del sito di Grillo?).
Una CDN e’ una tecnologia, o un insieme di tecnologie, che ha lo scopo di avvicinare i contenuti all’utente. Immaginate un grosso supermercato che ha una catena di distribuzione. Se si basasse su un immenso magazzino centrale, ogni negozio si troverebbe a richiedere le merci in esaurimento al magazzino centrale. Questo significherebbe un enorme traffico concentrato nel magazzino centrale, cui verrebbe richiesta una performance enormemente costante ed enormemente alta.
Per di piu’, una simile situazione non sarebbe efficiente: parte della spesa del magazzino avrebbe lo scopo di tenere il baccala’ finlandese disponibile ai portoghesi, che non lo mangiano.
Cosi’, supponiamo di avere una serie di magazzini locali, intermedi. I magazzini intermedi si riforniscono da quello centrale, ma adattano il loro buffer alle richieste dei clienti. Cosi’ il magazzino finlandese chiedera’ al magazzino centrale tutto il baccala’ finlandese, mentre quello portoghese chiedera’ qualsiasi cosa piaccia ai portoghesi che sognano il baccala’. A questo punto, il vantaggio e’ che il magazzino centrale puo’ anche fermarsi un giorno, tanto i magazzini periferici hanno scorta, e come se non bastasse, il percorso medio della merce si abbrevia.
Cosi’ fanno i grandi provider come Facebook: anziche’ tenere tutto in un datacenter centrale che sopporta tutto il carico, piazzano “vicine a voi” delle CDN, ovvero dei data center locali che , notando che in Italia vadano molto di moda i contenuti su Berlusconi e in Francia quelli su Hollande, htengono un nodo in francia ed uno in Italia , e ogni contenuto del nodo centrale, se viene richiesto molte volte da una zona sotto la responsabilita’ di un nodo CDN, viene spostato su quel nodo.
Quando cioe’ leggete un contenuto da Facebook, magari noterete un URL che finisce o contiene “Akamai”. Questo significa che akamai ha notato che quel contenuto e’ molto richiesto nella vostra “zona della rete”, e lo ha spostato dal data center di Facebook al nodo di akamai. Da quel momento, Facebook che viene informata di questo spostamento restituisce agli utenti di quella zona l’istruzione specifica di scaricare dal nodo Akamai.
La cosa che emerge e’ chiara: per fare questo, occorre che akamai sappia dove siete, da dove vi collegate, che contenuti state scaricando. Sapendo che vi collegate dall’italia , diciamo da telecom, facebook vi dara’ un link ad una copia del contenuto stesso, sita nel nodo CDN che e’ dentro la rete di telecom, in italia. Quindi, in definitiva, l’esistenza delle CDN equivale all’esistenza di compagnie di terze parti che riconoscono
- La frequenza con cui un dato contenuto viene scaricato.
- Il luogo da cui viene scaricato maggiormente il contenuto.
- Il luogo da dove il cliente che si connette chiede il contenuto.
La morale della storia e’ che il governo USA non ha alcun bisogno di accedere al database di Facebook, perche’ puo’ trovare piu’ conveniente, MOLTO piu’ conveniente, spiare usando i CDN, dal momento che implicitamente contengono gia’ le informazioni riguardo alla zona di provenienza dell’utente. Sapendo che un nodo CDN serve una certa area, la comparsa di un contenuto su quel nodo lo rende automaticamente rilevante per quell’area.
- Akamai Technologies
- Amazon CloudFront
- BitGravity (acquired by Tata Communications)
- CacheFly
- CDNetworks
- ChinaCache
- CloudFlare
- Cotendo (acquired by Akamai)
- EdgeCast Networks
- Highwinds Network Group
- Incapsula
- Internap
- Level 3 Communications
- Limelight Networks
- MetaCDN
- Mirror Image Internet
- NACEVI
- OnApp
- PageRain
- Rackspace Cloud Files
- Speedera Networks (acquired by Akamai)
- StreamZilla CDN Europe
- Windows Azure CDN
Per poter competere con una offerta pubblicitaria occorre garantire non solo di avere molto spazio e molti lettori, ma DI AVERLI CLASSIFICATI MOLTO BENE. Se prendiamo un giornale , puo’ dirvi che ha 600.000 lettori, e che se mettete un banner li’ lo vedranno in 600.000. Ma non puo’ garantirvi nient’altro, se non il “tipo” di lettore del suo giornale.
Cosi’, se esiste un’agenzia pubblicitaria intermedia, che vende “spazi facebook” o “consulenza sui nuovi media”, e’ assai probabile che il suo sistema di CRM (o sistemi analoghi) contenga un database INTERESSANTISSIMO per il governo. Non c’e’ alcun bisogno di fare tapping e poi consolidare ENORMI quantita’ di dati, quando esistono migliaia di aziende che si occupano di fare il lavoro per lo stato. basta chiedere il dato a loro.
Intendo dire che la somma di CDN e pubblicita’ e’ probabilmente la coppia di database PIU’ INTERESSANTI DEL MONDO per un governo che voglia spiarvi. Facebook e Gmail sono interessanti, si, ma se cerchiamo metadati sui contenuti INDICIZZATI IN MANIERA EFFICIENTE non abbiamo bisogno di reinventare la ruota: i CDN stanno GIA’ indicizzando chi, cosa e dove, mentre i pubblicitari stanno indicizzando … chi, cosa e come.
- Usa ALMENO una CDN, cioe’ Akamai , piu’ la CDN di twitter.
- Ha dietro alle spalle un’azienda di pubblicitari. esperti in clickstream &co.
e’ chiaro che di fronte ad una simile accoppiata, diventerebbe davvero imbarazzante un dibattito pubblico fatto da tecnici competenti che possano fare domande.
Verissimo, ma cosa sappiamo di akamai, twitter, facebook?(2)
E che cosa possiamo dire di un’azienda pubblicitaria su internet che, per definizione, vive vendendo servizi basati sui dati clickstream reaccolti?
Quindi no: il caso snowden e’ un caso piuttosto imbarazzante per M5S, per il quale NON mi aspetto una trattazione rigorosa o un dibattito che possa svegliare i tecnici. Quelli veri, non gli inventori del Cyberpunk.
Perche’ su un argomento simile, il sito di Grillo ha una infrastruttura perlomeno imbarazzante.(2)