Skip to content

Statistica fra le righe

Riflessioni sui metodi che molti danno per scontati

di Carlo Di Pietrantonj A e Arcangelo Liso B

La saggezza popolare ci insegna che il diavolo si nasconde nei dettagli, infatti non di rado il difetto che invalida un ragionamento non è rilevabile a prima vista, anzi a prima vista sembra tutto perfettamente logico. Spesso la sorgente di questi difetti invisibili è la tendenza a considerare una tecnica o una regola sempre valida solo perché lo è in una apparentemente ampia serie di circostanze a noi familiari. Un po’ come quando ci fidiamo dell’esperienza dei pochi amici e parenti, i quali non rappresentano quasi mai un campione che in termini tecnici si definisce “rappresentativo”, ovvero non forniscono quasi mai una descrizione rappresentativa della reale varietà dei fenomeni e della loro concreta possibilità di verificarsi.

L’interesse generale per i numeri ed il calcolo delle probabilità è sicuramente aumentata in questi mesi di pandemia. E anche molti politici ormai cercano di argomentare le loro posizioni con dei numeri, talvolta con competenza, purtroppo non dirado piegandoli per i propri scopi dialettici, fino al punto di paragonare la probabilità di essere colpiti da un meteorite con la mortalità da virus Covid19. Come è possibile non fare un uso spregiudicato dei numeri? Come possiamo non farci guidare dalle impressioni, ma affidarci invece all’analisi del contesto e delle regole?

Prendiamo il famoso paradosso delle patate dimenticate esposte al sole(1), all’inizio pesavano 1 quintale (100Kg)ed erano per il 99% acqua. Dopo un giorno al sole l’acqua si è ridotta ed ora sappiamo che rappresenta il 98% del peso. Si ma di quale peso? Cioè quanto pesano ora le patate?Pochi risponderanno che il peso complessivo delle patate si deve essere necessariamente dimezzato. I numeri 99 e 98  inducono all’errore, sembrano vicini se manca l’analisi e il ragionamento(per i più impazienti la risposta è di seguito riportata: prima dell’esposizione al sole la parte “secca” pesava 1 Kg ovvero era l’1% del peso totale, dopo l’esposizione al sole diventa il 2% del nuovo peso totale, ma non si è modificata, quindi ora 1 Kg è il 2% del nuovo peso).

E così se leggiamo che le auto elettriche in circolazione sono raddoppiate, forse dovremmo chiederci: rispetto a quale numero di partenza? Erano forse solo 5 e ora sono solo 10? O erano un discreto numero e ora sono molte di più?

Trappole analoghe si presentano in statistica o in epidemiologia dove la valutazione del denominatore può essere determinante, ad esempio quando dobbiamo confrontare i conteggi di un numero di eventi (ad es. nascite, decessi, malattia, ricorso ad un servizio sanitario) calcolati in differenti aree geografiche (comuni, distretti,province, regioni) oppure in differenti strati (classi di età, genere, titolo di studio, condizione di salute).

Paragonare i conteggi assoluti fra aree o strati in generale non è lecito, poiché le differenti numerosità dei casi fra aree (o strati) sono dovuti (in prima istanza) alle differenti dimensioni delle popolazioni che li hanno generati, pertanto l’indicazione generale è che il confronto può essere fatto solo fra i valori ottenuti dividendo il numero dei casi per la numerosità della popolazione che li ha generati, questo valore viene moltiplicato x 100, oppure x1000 o x100000, in questo modo esprime il numero di “casi attesi” ogni 100 1000 100000 individui appartenenti a quella popolazione, in un certo senso l’espressione “casi x 1000” indica una sorta di unità di misura.

Sottolineiamo che la popolazione posta al denominatore deve essere costituita da tutti e soli gli individui che avrebbero potuto generare gli eventi di interesse (talvolta definita popolazione generatrice dei casi o popolazione a rischio se l’evento è “sfavorevole”), in caso contrario il valore (del rapporto casi/popolazione) verrebbe artificialmente “diluito”(ridotto) in modo proporzionale alla dimensione della frazione di popolazione che non potrebbe generare quei casi (popolazione non a rischio), rendendo il confronto fra aree (o strati) distorto.

Infatti ad esempio (estremo) se si vuole confrontare il numero dei casi di disturbi che interessano solo la popolazione maschile, fra distretti sanitari di una regione, in questo caso dividere per la popolazione generale del distretto (senza distinzione di genere) sarebbe un errore. Infatti,se si usa come denominatore la popolazione generale la proporzione dei casi di quei disturbi verrebbe “diluita” proporzionalmente alla dimensione della popolazione femminile (popolazione non a rischio), pertanto la differenza della proporzione fra un distretto e l’altro rischia di dipendere dalla differente distribuzione fra maschi e femmine anziché da una reale differenza di rischio di malattia fra i distretti. Quindi per non cadere nella trappola è opportuno, in questi casi, eseguire il confronto dividendo solo per la popolazione di genere maschile (la popolazione a rischio).

Altrettanto insidiosa è la situazione nella quale si desidera confrontare il numero di eventi in diverse aree dove ogni individuo della popolazione di quell’area è “a rischio” per quell’evento, ma in misura differente a seconda dello strato di popolazione in cui si trova. L’esempio più comune è la mortalità, non esistendo gli immortali tutti sono a rischio di morire ma tale rischio aumenta con l’età, pertanto il numero dei decessi in una regione a prevalenza di individui anziani non può essere confrontato con il numero dei decessi avvenuti in una regione la cui popolazione a prevalenza di soggetti giovani, né in termini assoluti né utilizzando come denominatore solo la numerosità delle rispettive popolazioni generali. Infatti le differenze fra le proporzioni di decessi tra le varie regioni potrebbero essere determinate più dalla differente distribuzione per età più che da una reale differenza di rischio di decesso. In questo caso i confronti fra aree possono essere fatti suddividendo la popolazione e i soggetti che hanno presentato l’evento in un numero conveniente di classi di età di opportuna ampiezza, in modo da eseguire il rapporto decessi/popolazione all’interno delle classi di età, così sarà possibile eseguire il confronto fra classi di età corrispondenti tra le diverse regioni.

Nell’esempio con dati fittizi illustrato in figura 1 possiamo osservare dalla colonna Totale che il numero dei casi (ad esempio decessi) nella regione A è più grande rispetto alla regione B, anche il valore del rapporto con la rispettiva popolazione regionale sembra confermare questa osservazione, tuttavia l’analisi per classi di età rivela che la proporzione dei casi (rispetto alla popolazione specifica) è sistematicamente più grande per la regione B rispetto alla regione A.

Qui il diavolo che si annida nel denominatore (popolazione generale) è la differente distribuzione d’età delle due popolazioni, nella regione A circa il 25% della popolazione è 65 anni mentre nella regione B solo il 5% della popolazione è oltre i 65 anni, però in entrambe le popolazioni la maggior parte dei decessi avviene nella classe 65 anni, infatti nella popolazione B il maggior rischio (che si verifichi un caso) si concentra nell’ultima classe di età (come si osserva dal grafico nella figura 1). Quindi il totale dei casi nella regione A sono in maggioranza generati dall’ultima classe di età cosi come il totale della popolazione (A) è per lo più costituito da individui appartenenti all’ultima classe di età, mentre per la regione B sebbene la maggior parte dei casi si concentri nell’ultima classe di età, la popolazione generale è in minima parte costituita da individui ultra 65 anni, pertanto il rapporto “totale dei casi su popolazione generale” di fatto viene “diluito” dalla frazione più numerosa di popolazione sotto il 65 anni che contribuisce meno al numero dei casi.

Un errore analogo ha tratto in inganno alcuni commentatori che nelle prime fasi dell’epidemia hanno confrontato il tasso di letalità per COVID19 registrato in Italia con il tasso di letalità in Corea del Sud. Il tasso di letalità è il rapporto fra il numero dei decessi fra casi confermati di COVID19 e il numero totale dei casi confermati di infezioni da COVID19, negli articoli in lingua inglese indicato come CFR (Case Fatality Rate).

Possiamo replicare questo confronto utilizzando i dati dei casi confermati in Italia (al 7 aprile) pubblicati dall’Istituto Superiore di Sanità (2) e i casi confermati in Corea del Sud pubblicati su JPAM (3) relativi al medesimo periodo. Sulla base di queste informazioni il CFR (o tasso di letalità) in Italia risultava pari al 12.2% mentre in Corea del Sud risultava pari al 1.9%, quindi, apparentemente il tasso di letalità in Corea era inferiore a quello italiano.Bisogna sottolineare che nonostante la grande differenza fra i due CFR non è possibile concludere che in Italia il virus è più letale che in Corea poiché, come già notato da altri autori (4), le distribuzioni del numero dei casi confermati in Italia e in Corea del Sud si mostrano così differenti che da rendere inconfrontabili i due CFR.

Infatti, dalla figura 2 è possibile notare che il 73% dei casi confermati (al 7 aprile) in Italia si concentra nella popolazione >49 anni, mentre per la Corea del Sud solo il 42% dei risultano in quella classe di età, tuttavia in entrambe le nazioni il 98% del numero dei decessi era a carico di pazienti >49 anni, così come è stato accertato anche da altri autori che il maggior rischio di mortalità per COVID19 è a carico delle classi di età superiori (4) (5).

Quindi come nell’esempio in figura 1 la differenza di CFR è in parte dovuta a l’effetto di “diluizione” causato dalla differente distribuzione per età dei casi confermati (il denominatore) fra Italia e Corea del sud. In Corea la maggior parte dei decessi avviene, come in Italia, nelle classi di età superiori, ma la maggior parte del denominatore (i casi confermati) è costituito da soggetti appartenenti alle classi di età inferiori ai 50 anni, ovvero quelle a rischio più basso, in tal modo il rapporto “grezzo” decessi / casi confermati risulta diluito dalla frazione dei casi con un rischio di decesso inferiore.

Ovviamente a differenza dell’esempio 1 costruito a fini didattici, qui nel confronto fra CFR della Corea del Sud e CFR dell’Italia possono aver contribuito alla differenza, oltre al meccanismo illustrato sopra, anche le differenti strategie adottate per eseguire i testi virologici e la diversa tempistica dei test virologici le quali determinano il diverso grado di sottostima delle popolazione dei casi confermati (la tendenza a sottostimare il numero dei casi confermati tende a produrre sovrastime dei valori di CFR), infine anche i comportamenti e atteggiamenti fra generazioni possono influenzare il valore del CFR(4).

Un ulteriore esempio di allucinazione procurata dai denominatori si verifica quando siamo interessati a studiare come varia nel tempo la distribuzione del numero dei casi rispetto ad una loro caratteristica, si osservi ad esempio la figura 3 dove con dati fittizi sono rappresentate le percentuali per tipo di caso (sul totale dei casi) e il loro andamento nel tempo, a prima vista (il lettore distratto) potrebbe concludere che il “numero dei casi” di tipo 1 e 3 stiano aumentando mentre si stanno riducendo i casi di tipo 2, invece osservando la tabella sottostante, la numerosità complessiva dei casi si sta riducendo così come il conteggio dei singoli tipo di casi, sempre osservando la tabella possiamo notare che i casi di tipo 1 e di tipo 3 si riducono di 5 e 10 unità rispettivamente  alla settimana, mentre i casi di tipo 2 si riducono di 150 unità alla settimana. La riduzione più rapida dei casi di tipo 2 per contrasto fa accrescere le frazioni degli altri due tipi di caso sebbene in termini assoluti tutti i tipi si riducono. La figura 2 mostra che effettivamente nel tempo la distribuzione dei casi per tipologia si modifica e man mano si riduce la frazione (il peso sul totale) dei casi di tipo 2 e per contrasto si accresce il peso di quelli di tipo 1 e 3, tuttavia leggere questo grafico come se il denominatore fosse costante nel tempo trae in inganno rispetto alle reali tendenze dei valori assoluti.

In conclusione abbiamo illustrato alcuni aspetti che vanno tenuti in mente quando vogliamo confrontare fra loro la frequenza del numero dei casi calcolati all’interno di gruppi o strati, abbiamo sottolineato che in generale il confronto può essere fatto dividendola frequenza strato o gruppo specifica per la popolazione che ha generato quei casi (in ogni strato o gruppo). D’altro canto abbiamo visto che la sola ispezione delle proporzioni può essere ingannevole, in un certo senso il denominatore in sé può ingannare soprattutto se si perdono di vista i valori assoluti.

In un mondo dominato dalla comunicazione rapida ed emotiva, il nostro invito all’analisi attenta dei numeri e dei denominatori potrà sembrare naïve per alcuni. Eppure l’analisi attenta dei dati ha cambiato radicalmente i destini della storia e ha consentito per esempio agli alleati di vincere la seconda guerra mondiale agendo a dispetto delle impressioni dei militari coinvolti (6). Mai nella storia abbiamo avuto a disposizione una quantità di dati e di fatti come nella nostra epoca, essi hanno bisogno di riflessione per essere valutati razionalmente ed utilizzati nelle decisioni.

A. Dirigente Analista Servizio Regionale Epidemiologa SeREMI – ASL Alessandria;

B. Professore Ordinario, Dipartimento di Scienze Mediche e Chirurgiche, Università di Foggia

Bibliografia

  1. Paulos, J. A.A Mathematician Reads the Newspaper. New York: Basic Books, p.81, 1995
  2. https://www.epicentro.iss.it/coronavirus/bollettino/Infografica_7aprile%20ITA.pdf
  3. Joo H, Kang Y, COVID-19 Infection in South Korea: Focusing on Age Distribution of Confirmed Cases. J Pure ApplMicrobiol. 2020;14(suppl 1):721-723. doi: 10.22207/JPAM.14.SPL1.08.https://microbiologyjournal.org/covid-19-infection-in-south-korea-focusing-on-age-distribution-of-confirmed-cases/
  4. Backhaus A. Common Pitfalls in the Interpretation of COVID-19 Data and Statistics. Inter Econ. 2020; 55(3): 162–166. Published online 2020 Jun 7. doi: 10.1007/s10272-020-0893-1. PMCID: PMC7276107. PMID: 32536714. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7276107/
  5. https://www.cdc.gov/coronavirus/2019-ncov/covid-data/investigations-discovery/hospitalization-death-by-age.html
  6. Jordan Ellenberg. 2014.“How Not to Be Wrong: The Power of Mathematical Thinking” Penguin Group.

Condividi questo articolo: