statistica

Dalla censura alle statistiche farlocche, passando per la discriminazione

Data di trasmissione

Apriamo con due episodi di censura: il primo riguarda la censura di servizi legati anche alle VPN sui treni ad alta velocità di Italo; il secondo riguarda il progetto Gutenberg, un sito dove è possibile - in maniera del tutto legale - scaricare libri privi di copyright.

Dall'esplosione delle rivolte negli USA, Signal - una app di messaggistica sicura - ha messo a disposizione uno strumento in più: la possibilità di oscurare i volti quando si fanno delle foto. Se la fotocamera è uno strumento utile per denunciare il razzismo della polizia, non possiamo dimenticare che il razzismo è un fenomeno ben più ampio. Un esempio che vogliamo ricordare è quello del razzismo codificato negli algoritmi, in cui le visioni oppressive dominanti vengono trasformate più o meno volontariamente in un programma che poi arriva a prendere delle decisioni operative. Parliamo quindi di una sentenza negli USA che dimostra che - contrariamente a qualche interpretazione passata - studiare gli algoritmi ricercando eventuali discriminazioni insite in essi è sempre consentito dalla legge.

Passiamo ad alcune novità sulla responsabilità delle piattaforme social riguardo ai contenuti che ospitano, guardando ad una sentenza australiana e alla difficile gestione del copyright delle immagini caricate su Instagram.

Chiudiamo tornando a parlare di COVID19 e statistiche: uno studio che ha ricevuto molto credito  a livello  internazionale si è dimostrato basato su dati inventati;  gli Stati Uniti seguono invece un approccio "data driven", in cui i vari Stati guidano i dati con alcuni classici sotterfugi (tutta roba già vista in Europa comunque!).

Domenica 14 giugno le dita nella presa NON andrà in onda: al suo posto troverete una replica!

Top5: le peggiori statistiche sul coronavirus

Data di trasmissione
Durata 1h 38m 32s

Nel redazionale di oggi abbiamo fatto una sorta di classifica delle peggiori statistiche sul coronavirus: spesso i giornali ci presentano numeri sballati, esposti in maniera non chiara o addirittura sbagliata. Incompetenza o voglia di acchiappare click? Passiamole in rassegna, andando gradualmente dagli errori più grossolani alle osservazioni un po' più raffinate.

Esponiamo poi il modello predittivo SIR.

In chiusura, dei suggerimenti pratici per paranoico-statistici in erba: come leggere i numeri dal sito della protezione civile, fare i propri conti, utilizzando solo strumenti semplici e matematica elementare. Per facilitarvi il lavoro, vi alleghiamo anche il foglio di calcolo che abbiamo usato! (ovviamente non si tratta dell'unico modo, né del più valido, di leggere i dati; si tratta però quantomeno di un inizio, e di molto più di quello che trovate tipicamente sui giornali)

Statistiche e tracciamento ai tempi del coronavirus

Data di trasmissione
Partendo da una statistica presentata dalla regione Lombardia che tende a dimostrare l'ancora eccessiva mobilità della popolazione nonostante i decreti, facciamo quattro conti
per vedere quanto le conclusioni tratte siano veramente supportate dai dati statistici, e in generale quanta validità abbiano quei dati rispetto alla domanda posta. 
Il nostro risultato permette sostanzialmente di giungere alla conclusione opposta rispetto allo studio originale, facendo solo qualche assunto sulla sopravvivenza della popolazione.
 
Parliamo poi della diffusione del sistemi di sorveglianza e autosorveglianza, declinati come necessari nella lotta all'epidemia, sia in Italia sia in altri paesi, 
come Israele (che ha comunque una lunga tradizione in tema di sorveglianza della popolazione).
Questa diffusione è dovuta anche all'imitazione del modello "virtuoso" della corea del sud, che ha tracciato tutti i cittadini e reso pubblici i movimenti di quelli positivi per permettere al resto della cittadinanza di "difendersi". Un approccio non solo invadente della privacy, ma di cui non è chiara l'utilità.
 
In conclusione discutiamo brevemente altri due argomenti:
  • il "problema" della scarsità di tamponi analizzati in italia rispetto a quello che da più parti si considera il necessario (sempre chiamando in causa il "modello" corea del sud) e il contributo che il mondo scientifico potrebbe dare alla lotta contro l'epidemia.
  • come sopravvivere alla scarsità di banda in un mondo che ormai vede la rete come una delle poche forme di intrattenimento e lavoro ancora consentite? commentiamo la soluzione proposta dal sole24 ore e le promesse delle major dei video online di ridurre il consumo di banda. Recentemente avevamo dedicato un approfondimento all'insostenibilita' economica tecnica e ambientale di un sistema di intrattenimento e comunicazione basata sui video. Ascoltalo qui.

INVALSI: oggettivi... forse!

Data di trasmissione

Oggi parliamo dell'INVALSI, il famigerato test a risposta chiusa che ogni studente deve fare 5 volte nel corso del suo ciclo di studi. Analizziamo in particolare le stranezze statistiche di questo test. Infatti non si capisce se questo test debba offrire valutazioni collettive (sull'intero sistema scuola) o individuali (sulla singola studente). Anche le sue statistiche sul cheating lasciano piuttosto a desiderare: un'analisi superficiale dei dati ci dice che più del 50% delle classi ha l'abitudine di scopiazzare; guardandoli meglio, però, vediamo che è la statistica ad essere costruita esattamente per dare questa risposta.

Letture consigliate: