(Bio)Informatica

Un algoritmo che dà la caccia ai serial killer può prevedere la diffusione del Covid-19

A chi non è capitato di vedere nei film polizieschi come gli investigatori con pochi click sul computer riescano a risalire all’abitazione di un criminale a partire dai luoghi in cui ha commesso i delitti? Metodi del genere vengono utilizzati realmente dalle forze dell’ordine, ma non solo da loro: queste analisi, effettuate grazie ad un algoritmo con approccio topologico, possono risultare utili non solo per stanare i serial killer, ma anche per studiare la diffusione del Covid-19. Lo dimostrano gli scienziati del Centro Ricerche Semeion di Roma con il loro studio pubblicato sulla rivista Physica A, che si occupa di ricerche di meccanica statistica e delle loro applicazioni nei sistemi macroscopici.

L’algoritmo TWC per prevedere le mosse dei serial killer e la diffusione del Covid-19

I ricercatori del Centro Ricerche Semeion di Roma, in collaborazione con il dipartimento di Matematica e Scienze statistiche della University of Colorado di Denver e della Fondazione Vsm di Villa Santa Maria di Tavernerio di Como, si sono chiesti se sia possibile utilizzare gli algoritmi appartenenti alle metodologie di Geographic Profiling impiegati in ambito investigativo anche per determinare la diffusione geografica di un virus come il Covid-19.

In ambito forense la definizione di un profilo geografico consiste nell’analisi dei dati geografici dei luoghi in cui sono stati commessi diversi reati seriali. Grazie a questi dati si riesce a individuare un’area di possibile residenza dell’offender e avere indicazioni sui movimenti futuri del criminale.

Credits: macrovector_official – it.freepik.com

Applicato al Coronavirus in una forma notevolmente avanzata, l’algoritmo a partire dalla distribuzione corrente dei contagi è in grado di individuare il luogo da cui i contagi hanno avuto origine e l’evoluzione geografica futura del virus.

Come afferma il presidente del Centro Semeion Massimo Buscema in un’intervista a Rai Isoradio “nella grande maggioranza dei casi le analisi epidemiologiche vengono fatte con dei modelli matematici che non tengono conto di dove si manifestano i casi. Tengono conto solo di quanti casi si manifestano e quando, ma non dove.”
La novità dell’algoritmo impiegato consiste quindi proprio nel dare priorità al linguaggio dello spazio. In particolare l’algoritmo, chiamato TWC (Topological Weighted Centroid), viene definito dal Centro Ricerche Semeion come centro di massa di un certo numero di entità in uno spazio bidimensionale, pesato dal rapporto di vicinanza che ognuna di queste intrattiene con le altre entità.

Da pochi dati all’individuazione del focolaio italiano

L’algoritmo è stato applicato allo studio della diffusione del virus in Italia. Sono state raccolte le coordinate (longitudine e latitudine) di 24 città in cui è stato registrato almeno un contagio fino al 26 febbraio 2020.

Mappa della diffusione del Covid-19 in Italia per provincia, aggiornata al 26 Febbraio 2020. Credits: modificata dall’immagine di Dany Crash

Con questi dati l‘algoritmo è riuscito a determinare il focolaio della diffusione italiana del Covid-19 con un errore di 40 km (39 km a sud-est rispetto a Codogno). Gli scienziati hanno inoltre potuto prevedere che la diffusione più severa del coronavirus si sarebbe verificata nel nord Italia.

Nonostante il numero esiguo di dati di partenza, costituiti dalle sole coordinate spaziali, senza avere a disposizione informazioni temporali e il numero preciso di contagi, i risultati si sono rivelati molto interessanti e il modello è considerato dai ricercatori molto plausibile. Come afferma sempre il professor Buscema il modello TWC risulta estremamente utile per “processi di diffusione di qualsiasi natura quando si hanno pochi dati, incompleti, incerti e senza un ordine temporale preciso”.

Published by
Verdiana Brullo