L’ANALISI DEL PTS SUI DATI DISPONIBILI
Nota del Presidente del PTS – prof. Guido Poli
La ripresa delle attività scolastiche in presenza è coincisa con una ripresa generale e preoccupante dell’epidemia. La domanda centrale è se le scuole siano “vittime” dell’epidemia in corso o ne siano attivi moltiplicatori. La sfasatura temporale dell’apertura delle scuole in diverse aree ha consentito a Enrico Bucci e Antonella Viola di analizzare i dati che inequivocabilmente, almeno nei limiti del primo mese di osservazione, scagionano le scuole come moltiplicatori d’infezione.
Enrico Bucci ed Antonella Viola, membri del direttivo del PTS hanno condotto una analisi sulla base dei dati disponibili per ricostruire l’andamento delle infezioni nelle scuole, al fine di rispondere al seguente quesito: possono le scuole essere considerate un luogo particolarmente rischio, sulla base dei dati disponibili?
Risultati in breve.
Dalla riapertura delle scuole, è iniziato il monitoraggio dei casi di positività a SARS-CoV-2 sia tra gli studenti che fra il personale scolastico.
I dati di analisi dell’incidenza nel tempo, cioè la dinamica di propagazione del virus nelle scuole, non è finora stata studiata in dettaglio, soprattutto a causa della grave mancanza dei dati necessari, i quali sono stati certamente raccolti ma non messi a disposizione né, per quanto se ne sa, utilizzati.[1]
L’analisi presentata qui di seguito tenta di ricostruire l’andamento delle infezioni nelle scuole, al fine di rispondere al seguente quesito: possono le scuole essere considerate un luogo particolarmente rischio, sulla base dei dati disponibili?
Per rispondere, si sono utilizzati due approcci indipendenti: uno direttamente basato sui dati disponibili per le scuole, ed uno volto a cercare effetti della riapertura sulle curve epidemiche regionali, confrontando regioni che hanno aperto prima con regioni che hanno aperto dopo,
Nonostante le limitazioni, principalmente dovute alla difficoltà nel reperire i dati necessari e alla correlata difficoltà nel controllare per eventuali bias di campionamento, le conclusioni ottenute sono complessivamente le seguenti.
- I dati considerati non supportano un ruolo delle scuole come “moltiplicatore” di infezioni
- I dati considerati mostrano che le scuole non sono più protette del resto della comunità
- Il tasso di infezione scolastica appare seguire quello della comunità circostante
- La probabilità di infezione in una scuola non è significativamente diversa da quella della società nel suo complesso
Raccomandazioni.
Come detto, i nostri dati suggeriscono che non al momento non esistano motivi per evocare la chiusura delle scuole più di quanto non ve ne siano per un lockdown dell’intera società, poiché non sembra ascrivibile alla scuola l’aumento dei contagi. Al contrario, la scuola è fondamentale per la formazione, la socialità, lo sviluppo e il benessere dei bambini e dei ragazzi e la sua chiusura causerebbe danni gravissimi alle future generazioni e al Paese, ivi compresi danni di salute, come riportato in letteratura scientifica.
Al fine di proteggere la scuola dal diffondersi del contagio, è però urgente intervenire sulle regole e sulle procedure per la tracciatura ed il contenimento di eventuali focolai scolastici.
Innanzitutto, ricordiamo che al momento in Italia vi è un’inaccettabile disparità di indicazioni da regione a regione; questa deve essere abbandonata, in favore di una procedura unica.
In secondo luogo, la diagnostica in ambio scolastico deve essere anche essa uniformata e potenziata, attraverso l’introduzione di test rapidi antigenici e la procedura di pooling, in modo da evitare di affaticare ulteriormente il sistema diagnostico nazionale, già sotto stress per la ripresa epidemica in atto.
Fatte queste premesse, ricordiamo di seguito alcuni tra i punti che consideriamo più importanti.
Studio numero 1: l’andamento del contagio nelle scuole di alcune aree geografiche selezionate.
Grazie all’analisi delle fonti giornalistiche che riportano le dichiarazioni delle corrispondenti autorità sanitarie, è stato possibile reperire alcuni dati per quel che riguarda il numero di positivi nel tempo riscontrati nelle scuole della provincia di Milano, di quella di Bergamo e dell’intera regione Lazio.
I dati crudi cumulati, normalizzati per 100.000 unità di popolazione scolastica (intendendo la somma degli studenti, del personale docente e di quello tecnico-amministrativo) sono rappresentati di seguito.
Come è possibile notare dalla figura, per tutti e tre i gruppi di scuole considerati si osserva una crescita esponenziale del numero di casi cumulati nel tempo (e, corrispondentemente, dell’incremento di casi registrati).
Per sapere se le scuole costituiscono ambiente di particolare contagio, è necessario confrontare la crescita nel tempo del numero di casi positivi nelle scuole a quella registrata nella corrispondente area geografica. Tuttavia, si pone preliminarmente il problema di valutare se il campionamento all’interno delle scuole sia quantitativamente paragonabile a quello che avviene all’esterno delle scuole; un eventuale sottocampionamento porterebbe infatti a risultati artificiosamente più bassi nelle scuole rispetto a quelli sulla popolazione.
Per quel che riguarda Bergamo, si dispone fortunatamente dei tamponi effettuati nelle scuole in diversi intervalli di tempo a partire dal 14 settembre. In mancanza dei dati per l’intera provincia di Bergamo, la percentuale di soggetti testati fra i membri della popolazione scolastica di quella provincia può essere paragonata alla percentuale di testati fra gli abitanti dell’intera Lombardia.
Il risultato è riportato di seguito.
Come si può notare, almeno per le scuole di Bergamo non sembra che si sia sottocampionata la popolazione scolastica rispetto alla popolazione della regione in nessuno dei periodi considerati; inoltre, si osserva come la percentuale di test effettuati nelle scuole aumenti e diminuisca in corrispondenza degli aumenti e delle diminuzioni dei test a livello regionale, con una correlazione che è buona escluso il periodo iniziale, in cui si effettuavano meno test nelle scuole per ovvi motivi di avviamento. Questo tipo di semplice analisi, se esteso opportunamente a tutti i dati sulle scuole in possesso di ATS e regioni, potrebbe rassicurare almeno circa l’assenza del più grossolano fra i bias di campionamento; nell’ipotesi che ciò che avviene in Lombardia e a Bergamo non sia troppo diverso da quanto avviene in altre regioni d’Italia, passiamo quindi all’analisi che più ci interessa, ovvero alla comparazione delle percentuali di infezioni della popolazione scolastica rispetto alla popolazione di riferimento.
Come si può notare dai grafici, in cui si riporta il numero medio giornaliero di casi per 100.000 nelle scuole e nell’area di riferimento per i periodi indicati, le scuole (linee blue) non presentano mai un andamento peggiore rispetto alla popolazione complessiva.
La piccola discrepanza (non significativa) per Bergamo è spiegabile con il noto ritardo nell’esecuzione dei campioni nella popolazione rispetto all’immediatezza con cui ciò è stato fatto nelle scuole[2].
L’apparente deviazione (in meglio) delle scuole milanesi rispetto alla popolazione globale è invece spiegabile con gli effetti di saturazione del sistema di diagnosi e tracciamento dell’ultimo periodo, che hanno spostato sempre più i tamponi verso l’indagine clinica, abbandonando quella epidemiologica[3].
Infine, la corrispondenza fra infetti nelle scuole e sul totale osservata nel Lazio rinforza l’idea che, in sostanza, le scuole rappresentino solo una particolare finestra di osservazione all’interno di una popolazione più grande.
RISULTATO DELL’ANALISI:
Nei tre campioni esaminati (Provincia di Milano, Provincia di Bergamo, Regione Lazio) la circolazione del virus nelle scuole non appare superiore a quanto avviene nel complesso nella comunità di riferimento.
LIMITI DELL’ANALISI:
I dati sui tamponi effettuati nelle scuole, indispensabili per escludere sovra- o sottocampionamento, sono stati reperiti solo per la Provincia di Bergamo.[4] Sebbene per il Lazio un bias di campionamento appaia improbabile (perché è difficile immaginare un sottocampionamento o un sovracampionamento effettuato in maniera tale da dare esatta sovrapposizione fra le curve dentro e fuori le scuole), è invece possibile che un bias di sottocampionamento affligga i dati provenienti dalle scuole di Milano nell’ultima settimana.
Studio numero 2: l’effetto delle riaperture delle scuole sulle curve epidemiche.
Un secondo tipo di approccio possibile per valutare l’eventuale effetto delle scuole come “moltiplicatore” dei casi di infezione consiste nel ricercare tale effetto direttamente sulle curve epidemiche: se tale effetto esistesse ed avesse un peso significativo, esso dovrebbe manifestarsi come deviazione delle curve epidemiche dall’andamento manifestato precedentemente alla riapertura scolastica.
Al fine di meglio caratterizzare questa possibilità, è possibile confrontare l’andamento epidemico delle regioni che hanno aperto le scuole il 14 Settembre con quelle in cui la riapertura è stata rinviata al 24 settembre.
Essendo comunque in un periodo di ripresa epidemica in tutte le regioni italiane, Il test che si effettua è dunque volto ad identificare delle differenze significative fra l’aumento dei casi osservati per le regioni che hanno riaperto prima e quelle che hanno riaperto dopo.
Di seguito, si osserva la media dei casi giornalieri per le regioni che hanno riaperto il 14 settembre (linea rossa) e quelle che hanno riaperti il 24 settembre (linea nera). Per ciascun giorno, è riportata la deviazione standard intorno alla media dei casi giornalieri per 100.000 abitanti.
Anche se ad uno sguardo superficiale potrebbe sembrare che le regioni che hanno riaperto prima (linea rossa) abbiano una curva che cresce più rapidamente delle altre, questa impressione non è corretta: infatti, la dispersione di quelle regioni intorno alla media aumenta notevolmente (barre di errore), il che si riflette nella assenza di significatività statistica per la deviazione osservata (t test multipli su ogni giorno non rilevano nessuna differenza significativa per nessuna giornata nell’arco di tempo indicato).
Per favorire la comprensione di quanto sta accadendo, basta dire che la media in rosso nasconde regioni in cui l’epidemia cresce più significativamente ed altre in cui la crescita è indistinguibile dalle regioni rappresentate con la media in nero (regioni ad apertura più tardiva); lo stesso vale, a parti invertite, per la linea nera.
Di seguito, si mostra qualche esempio per mostrare come, in sostanza, la crescita più o meno veloce della curva epidemica è indipendente dalla data di riapertura delle scuole.
La Campania che ha riaperto il 24 settembre, per esempio, cresce altrettanto velocemente delle regioni più veloci tra quelle che hanno riaperto il 14, come la Lombardia; viceversa il Veneto, che ha aperto il 14 settembre, non cresce più velocemente dell’Abruzzo, che ha riaperto il 24 settembre.
Peraltro, va aggiunto che se vi fosse un effetto della riapertura delle scuole misurabile, esso dovrebbe manifestarsi a tempi diversi nelle corrispondenti regioni; al contrario, come si può vedere, le curve epidemiche per tutte le regioni considerate iniziano a crescere in maniera grosso modo simultanea.
RISULTATO DELL’ANALISI:
La differenza di progressione epidemica nelle regioni italiane non è spiegata dalla data di riapertura delle scuole. Viceversa, nelle prime 5 settimane dalla riapertura della scuola per la maggior parte delle regioni italiane, la data di riapertura delle scuole non distingue fra le regioni in cui la curva epidemica ha maggiormente accelerato e le altre.
LIMITI DELL’ANALISI:
Effetti esponenziali potrebbero manifestarsi su periodi più lunghi, ed essere invisibili nella finestra di tempo considerata. Inoltre, la rumorosità dei dati disponibili potrebbe mascherare anche di effetti di una certa entità.
[1] Le fonti dei dati utilizzati e le analisi descritte in questo documento saranno messe a disposizione di chi ne farà richiesta al presidente del Patto per Trasversale per la Scienza prof. Guido Poli.
[2] https://www.ecodibergamo.it/stories/premium/Cronaca/meno-medici-e-incognita-tamponie-ce-il-mistero-dei-tracciatori_1374456_11/
[3] https://www.fanpage.it/milano/milano-con-laumento-dei-casi-torna-il-caos-tamponi-fino-a-13-giorni-per-farlo/
[4] Ancora una volta, si sottolinea come, in linea con quanto richiesto dal presidente dell’Accademia Nazionale dei Lincei prof. Giorgio Parisi, a nome dell’intera comunità scientifica, i dati esistono (perché sono poi aggregati e discussi come tali), e devono essere messi a disposizione se si vuole cercare di ottenere analisi che abbiano un qualche significato.