Dati COVID: guida per non addetti ai lavori

Analisi dei dati comunicati dalla Protezione Civile fino al 17/05/20

Il 24 febbraio alle ore 12:00 sul sito della Protezione Civile compare il seguente comunicato:

“Presso la sede del Dipartimento della Protezione Civile proseguono i lavori del Comitato Operativo al fine di assicurare il coordinamento degli interventi delle componenti e delle strutture operative del Servizio Nazionale della Protezione Civile.
Nell’ambito del monitoraggio sanitario relativo alla diffusione del Coronavirus sul territorio nazionale, al momento risultano contagiate 219 persone in 5 regioni.
Nel dettaglio: i casi accertati di Coronavirus in Lombardia sono 167, 27 in Veneto, 18 in Emilia-Romagna, 4 in Piemonte, 3 nel Lazio. I pazienti ricoverati con sintomi sono 99, 23 sono in terapia intensiva, mentre 91 si trovano in isolamento domiciliare. Una persona è guarita, mentre 5 sono decedute.”

Dal 24 febbraio a questa parte, ogni giorno alle 18:00, sul sito della Protezione Civile viene pubblicato un comunicato stampa relativo al monitoraggio dei “dati del coronavirus”.
Fino alla fine di aprile, tale comunicato era accompagnato anche da una diretta streaming presieduta dal capo della Protezione Civile Angelo Borrelli.
La comunicazione è guidata dal principio che si debba informare tutta la popolazione italiana di come si stia sviluppando l’epidemia (quanti “contagiati” ci sono), di quante vittime stia facendo in Italia (i “deceduti”), di quanto stia peggiorando o migliorando la situazione (la crescita o decrescita dei “ricoverati”).

Durante il corso di questi mesi lo scheletro del comunicato ha subito dei cambiamenti.
I primi giorni venivano segnalati:

  • il numero totale dei casi registrati fino a quel giorno, indicato come “le persone contagiate”, anche divisi per regione;
  • il numero di guariti;
  • il numero di deceduti, sul quale quasi da subito si manifesta l’incertezza, specificando l’attesa di una conferma dall’Istituto Superiore di Sanità sulle cause della morte;
  • il numero di ricoverati (sia in terapia intensiva che non);
  • il numero dei positivi in isolamento domiciliare.

Tra le righe, si può leggere che la somma degli ultimi due dà il numero di persone attualmente positive.
Nell’esempio, 99+23+91=213. Se gli si aggiunge la somma di guariti e deceduti (5+1=6) si ottiene il totale dei casi (219).
Dal 29 febbraio, anche il numero degli “attualmente positivi” inizia a comparire esplicitamente nei comunicati con la dicitura “al momento, 1049 persone risultano positive al virus”, distinguendolo dai casi totali che venivano descritti così: “ad oggi, in Italia, 1128 persone hanno contratto il virus” e successivamente denominati solo con “casi totali”.

Prima di proseguire, è bene precisare che tutti i dati rilasciati, e quindi quelli di cui si parla nell’articolo, sono i casi rilevati, che non costituiscono la reale totalità dei casi esistenti. Sono presenti infatti dei bias di selezione, indotti dalle modalità con cui si verifica se una persona è positiva o meno. Almeno nelle fasi iniziali venivano fatti tamponi per verificare la positività al virus solo a persone sintomatiche e ai loro familiari, ed eventualmente a persone venute in stretto contatto con i pazienti. L’osservazione va estesa anche alla mortalità: bisogna fare attenzione a come si conteggiano i deceduti. In quali casi il COVID-19 è la causa di morte? Come si tiene in considerazione l’esistenza o meno di malattie pregresse nel paziente? Questi dati influiscono sull’indice di mortalità che si può dedurre da essi.  

Chiarite tali premesse, in ogni caso all’inizio non si potevano fare molti commenti o ulteriori considerazioni: ci si limitava a registrare cosa succedeva. Questo tipo di comunicazione è stato portato avanti per quasi due mesi, fino al 18/04, quando si comincia per la prima volta a parlare non solo di numeri totali, ma anche di andamenti. Il sottotitolo del comunicato del 18 aprile recita: “calano ancora i ricoveri in terapia intensiva”. “Calano”, cioè l’attenzione è posta non su “quanti” ma su “quanti rispetto a ieri”. Questa è un’informazione più interessante del dato in sé e per sé: è l’andamento di un certo dato che in questo caso ci fa capire qualcosa. Nell’esempio, possiamo pensare che finalmente cominceranno a svuotarsi i reparti di terapia intensiva. Da quel giorno fino ad oggi, è stata dichiarata esplicitamente la variazione di tutti i numeri rispetto al giorno precedente. Un numero da solo non può mai significare molto: bisogna sempre paragonarlo ad altri numeri per capire se è grande o piccolo, così come una persona non è “alta” in assoluto, ma lo è rispetto ad altre persone, o rispetto alla sua età. Ad ogni modo, una volta che ci si riesce a districare nella giungla dei dati…tutti questi numeri che cosa vogliono dire? Come possono aiutare a comprendere la situazione? Quali sono quelli importanti e per quale scopo?

Due giorni dopo, il 20/04, si annuncia: “In calo per la prima volta il numero delle persone attualmente positive”. Questa sì che è un’altra notizia: il 20 aprile sono risultate positive meno persone di quelle che non lo sono più. Certo, bisognerebbe anche vedere che fine hanno fatto “le persone che non lo sono più”: potrebbero essere fortunatamente guarite, oppure potrebbero anche essere decedute. In questo caso alla variazione del dato in sé sarebbe bene anche aggiungere un’altra informazione, per capire se la notizia che il dato porta con sé sia positiva o negativa. Il bilancio degli “attualmente positivi” dipende dall’incremento dei nuovi positivi ma anche dall’uscita di scena degli ex positivi, composto sia da guariti che da deceduti. Quindi l’affermazione sopra citata potrebbe voler dire: “meno persone risultano positive”, ma anche “tante persone sono guarite”, e ancora “tante persone sono morte”.
Ogni dato ci dà un’ informazione ben precisa, e ogni informazione risponde a una domanda specifica.
Di seguito alcuni esempi.

Un dato fra tutti ci fa capire come sta andando l’epidemia, cioè quanto velocemente si diffonde il contagio. Questo è il totale dei casi, che in gergo si chiama anche il numero dei positivi incidenti. Esso è un numero in continua crescita, perché ogni giorno si registrano nuovi casi, anche se l’epidemia rallenta. Al massimo si può arrivare ad un punto in cui non se ne registreranno più molti, e allora potrà rimanere pressoché costante.
Il numero in sé e per sé non parla, non dice niente di interessante. Acquista senso e significato se si guarda la sua variazione da un giorno all’altro, ovvero come questo numero aumenta di giorno in giorno. Il numero cresce velocemente? Anche la malattia si diffonde rapidamente. Il numero cresce lentamente? Anche la malattia si diffonde lentamente.

C’è un modo di visualizzare questa informazione in maniera semplice: costruire dei grafici. Se rappresentiamo il totale dei casi al trascorrere dei giorni dal 24 febbraio ad oggi, vedremo una successione di punti che disegna il grafico di una curva. Nella Figura 1 il grafico in alto mostra la curva dei dati, quello in basso la variazione da un giorno all’altro (casi del giorno attuale meno i casi del giorno precedente). Più la curva è ripida più la variazione è alta, e quindi è veloce la diffusione della malattia. Più la curva si addolcisce nella crescita più la variazione è bassa, e quindi la diffusione rallenta. Infatti il picco nel secondo grafico corrisponde proprio ad un cambio di ripidità del primo grafico.


Andamenti dei casi incidenti dal 24/02 al 17/05. Il grafico in alto mostra l’andamento dei dati, il grafico in basso la variazione della prima curva, ottenuta per ogni giorno come differenza (assoluta, non percentuale) tra il dato e quello precedente.
Grafico prodotto dall’autrice con i dati scaricabili dal sito https://github.com/pcm-dpc/COVID-19

Attenzione però, il fatto che la diffusione sia veloce o lenta non dipende dal virus in sé. La diffusione nel Paese dipende soprattutto da cosa noi cerchiamo di fare per ridurne la trasmissione. Tutte le misure prese dal governo in questi mesi sono volte ad addolcire questa curva, ed essa ha effettivamente rallentato dopo le chiusure delle attività, dopo i decreti volti a farci stare a casa il più possibile, dopo il divieto di viaggiare liberamente. Il virus si diffonde meno perché gli diamo meno possibilità di farlo.

Un altro dato risponde invece alla domanda “il sistema sanitario riesce a garantire le cure a tutti i pazienti?”. Per capirlo, bisogna guardare il numero di attualmente positivi, che in gergo si chiama numero di positivi prevalenti. Sono cioè tutte le persone che sono positive in un determinato giorno. Esse possono stare in ospedale (sia in terapia intensiva che non) oppure venire isolate in quarantena nelle loro abitazioni. Questo è un numero che sicuramente all’inizio dell’epidemia è in crescita, e anche molto velocemente, perché la malattia è incontrollata e non ne viene rallentata la diffusione. Col passare del tempo però, man mano che vengono prese determinate misure, il numero di positivi prevalenti può rallentare la sua crescita, fino a fermarla del tutto, e iniziare a decrescere. Cioè, arriva un momento in cui oggi ci sono meno persone contagiate di ieri.

Quel momento è arrivato per la prima volta il 20 aprile, come citato in precedenza. Che sia per un maggior numero di guariti o di decessi, o per un minor numero di nuovi casi, il risultato è comunque quello di avere un picco, al quale segue una decrescita. In Figura 2 è rappresentata, come in precedenza, in alto la curva dei casi, in basso la sua variazione. Quando la prima raggiunge il picco del 20 aprile, la seconda attraversa la soglia rossa dello zero: da questo momento la differenza “positivi di oggi meno i positivi di ieri” è negativa. È questo il famoso picco che va mantenuto abbastanza basso per non gravare eccessivamente sulle capacità del sistema sanitario.


Andamenti dei casi prevalenti dal 24/02 al 17/05. Il grafico in alto mostra l’andamento dei dati, il grafico in basso la variazione della prima curva, ottenuta per ogni giorno come differenza (assoluta, non percentuale) tra il dato e quello precedente.
Grafico prodotto dall’autrice con i dati scaricabili dal sito https://github.com/pcm-dpc/COVID-19

La vera buona notizia che porta la decrescita di questa curva è che si alleggerisce il peso sul sistema sanitario nazionale, e di conseguenza a tutti i malati viene offerto un servizio adeguato alle loro esigenze, evitando il ricorso a strutture inadatte.
Ciò permette anche, con il tempo, di poter avere meno decessi: il personale sanitario può seguire adeguatamente e con le strumentazioni necessarie i malati, che vengono curati al meglio e hanno più possibilità di guarire velocemente.

Naturalmente questi sono solo un paio di esempi di come guardare ai numeri da cui siamo stati sommersi: si possono fare grafici e andamenti di tutti i numeri citati nei comunicati (numero di decessi, numero di pazienti in terapia intensiva…) oppure calcolarne di nuovi. Un’altra operazione rilevante è quella di costruire tali grafici per ogni singola regione e metterli a confronto, oppure confrontare l’Italia con gli altri Paesi. Il confronto è sempre la regola base dell’analisi dei dati: bisogna sempre diffidare di un dato come singolo numero, e guardarlo nell’insieme.

Si conclude qui questa guida alla lettura dei dati, ma si possono aprire numerose altre domande, osservando i grafici e gli andamenti.
Come vengono rilevati questi dati? Quanto sono affidabili? Si possono fare previsioni di come andrà avanti l’epidemia, e non solo registrare come si è sviluppata? Per rispondere a tali domande bisogna cercare di capire da una parte i criteri adottati per stabilire i nuovi casi, o come si determinano i decessi causati proprio da questo virus…e dall’altra si spalanca la porta al mondo dell’epidemiologia e dei suoi modelli.

Fonti

http://www.protezionecivile.gov.it/media-comunicazione/comunicati-stampa

https://www.scienzainrete.it/articolo/incidenza-e-prevalenza-della-positivit%C3%A0-come-contare-nuovi-contagi/rodolfo-saracci/2020-03

Tags: , , , ,

Ancora nessun commento.

Lascia una risposta