In Lombardia Rt sottostimato: dati mancanti e consolidati in ritardo
La Lombardia è tornata in fascia arancione rafforzato e potrebbe finire in zona rossa dopo il monitoraggio settimanale dell'Iss. Come si è arrivati a un peggioramento così repentino della situazione epidemiologica, da fascia gialla a possibile fascia rossa in una settimana?
Una possibile risposta viene di nuovo dai dati. I numeri sui contagi Covid che la Lombardia invia al ministero della Salute erano già finiti al centro di feroci polemiche a gennaio, quando la regione finì in zona rossa "per errore", a causa di imprecisioni e lacune nei dati che avevano fatto impennare l'indice di contagio Rt. Ora il sospetto è che possa essere avvenuto qualcosa di simile, con effetti contrari. Così la Lombardia è entrata tardi in zona arancione.
Secondo un gruppo di data analyst, autori dell'account Twitter OpenCovid-mr, che hanno analizzato i dati resi pubblici dalla Regione, in Lombardia da metà gennaio l'indice Rt sarebbe già stato maggiore di 1, segnale di un'epidemia in espansione. Nei report ufficiali dell'Iss, redatti a partire dai dati inviati dalla Regione, l'indice è però sempre sempre stato minore di uno.
Il problema legato alla compilazione del campo Stato clinico
Perché l'Rt risulta più alto a posteriori? Come già emerso nelle scorse settimane, il problema sarebbe legato alla compilazione del campo "stato clinico" nelle tabelle. Un'informazione che spesso non veniva indicata nei report lombardi, o era indicata in modo parziale. Dopo aver ricevuto una serie di sollecitazioni per la mancata compilazione del campo "stato clinico", i tecnici lombardi lo avrebbero riempito in modo affrettato e impreciso, sottostimando il numero degli asintomatici (che rientrano nella colonna dei guariti ai fini del calcolo).
Dai dati messi a disposizione dalla Regione, pare ore che il campo "stato clinico" venga sempre compilato per tutti i casi e inoltre il passato recente è stato corretto. Lo si vede dal fatto che i casi con "nessuno stato clinico" sono a zero dall'8 dicembre in avanti. Ma secondo lo stesso gruppo di analisti è possibile che questo non sia comunque sufficiente ad avere la garanzia che la compilazione del database sia del tutto corretta.
Vengono infatti ancora inserite alcune decine di casi ogni giorno con "data inizio sintomi" ma con solo l'indicazione "guarito" o "deceduto". Mancano quelli con stato clinico sintomatico, che quindi non rientrano nella stima di Rt (stiamo parlando del 25 per cento dei casi circa 17mila su 70mila dal 1 gennaio ad oggi).
Il ritardo nel consolidamento nei dati
Perché i dati cambiano? Escludendo l'intenzionalità nel modificarli per aggiustare gli indicatori, la possibile spiegazione è legata ai ritardi di consolidamento. Istituto Superiore di Sanità e Fondazione Bruno Kessler – gli enti che analizzano i dati e certificano l'indice Rt – escludono dal conteggio gli ultimi 14 giorni perché non consolidati. Spiegano ancora gli analisti di OpenCovid-mr che l'esperienza di queste ultime settimane su cui abbiamo dati per fare delle verifiche dimostra che 14 giorni sono insufficienti, e in Lombardia (mancano nell'analisi le altre regioni, ma perché al momento solo la Lombardia fornisce dati in modalità open) ne sarebbero serviti almeno 21 o 28. In altre parole, i dati sui sintomatici di Regione Lombardia si consolidano così lentamente e in ritardo, che escludere soltanto gli ultimi 14 giorni ha prodotto una curva epidemica in perenne discesa fittizia, da cui derivava un Rt perennemente minore di uno.