Un proceso de Hawkes para sensibilizar a las personas sobre la gravedad del brote de COVID-19: aplicación a casos en Francia

Por Laurent Lesage

Proponemos un modelo simple basado en los procesos de Hawkes para comprender el contagio COVID-19 y hacer que las personas sean conscientes de la gravedad de la situación. No somos epidemiólogos y no pretendemos que podamos predecir con precisión el número futuro de casos. Nuestro objetivo es ver que nuestro modelo, que es simple y no tiene en cuenta muchos factores externos, nos permite captar la tendencia global del brote y resaltar el hecho de que sin un cambio en el comportamiento de las personas, el brote podría ser fuera de control. La originalidad del modelo es centrarse en la velocidad de propagación más que en el número de casos en sí. Para obtener más detalles, puede consultar nuestro trabajo de investigación sobre este tema.

Parte 1: Método

Utilizamos un proceso de Hawkes para modelar la evolución del brote en Francia y sensibilizar a los franceses sobre la gravedad de la situación. Muchos modelos y visualizaciones de datos que tratan este tema fueron propuestos por diferentes científicos en los últimos días. En particular, este estudio presenta algunas similitudes con nuestro modelo al utilizar un modelo autorregresivo de Poisson para adaptarse a la evolución del brote en China, Irán, Italia y Corea del Sur.

El proceso de Hawkes (HP) lleva el nombre de Alan G. Hawkes, quien introdujo el concepto de procesos de puntos autoexcitantes. El HP es un proceso puntual que modela la aparición de infecciones. Denotamos N (t) HP, que representa el número de casos en el tiempo t. También denotamos H (t) los datos históricos del proceso hasta el tiempo t, es decir, los contagios pasados.

En lugar de modelar N (t) directamente, trabajamos en λ * (.), Que representa la velocidad de propagación del brote. Matemáticamente hablando, λ * (.) Es la función de intensidad condicional y se define por:

Esta definición nos permite escribir:

lo cual es bastante fácil de entender, incluso sin ser un experto en matemáticas y probabilidad. Esta ecuación muestra que la probabilidad de observar un nuevo caso entre t y t + dt es proporcional a λ * (t). En otras palabras, cuanto mayor es λ * (t), más rápido crece N (t).

Esta ecuación es verdadera para cualquier tipo de procesos puntuales. Para un HP, la función de intensidad condicional tiene una forma particular:

que también es bastante fácil de leer:

  • el primer término, λ> 0, es la intensidad de fondo, que modela la infección de países extranjeros,
  • El segundo término, la suma en k, es la parte autoexcitadora del proceso. Para cada t_k, que representa los tiempos en que ocurrió un contagio en el pasado, agregamos una nueva parte μ (t-t_k) que aumenta λ * (t). Significa que cada caso "excita" el proceso al aumentar la velocidad de propagación del brote y la probabilidad de que ocurra otro contagio en un corto período de tiempo. Eso es lo que sucede durante un brote: cada nuevo caso podría transmitir el virus a otras personas y luego causar nuevas infecciones. μ (.) es una función decreciente: por lo tanto, suponemos que cada paciente es cada vez menos contagioso con el tiempo (lo cual no siempre es cierto según algunos científicos).

Parte 2: Resultados

Hemos aplicado el modelo a los datos del repositorio GitHub del Centro de Ciencia e Ingeniería de Sistemas (CSSE) de la Universidad Johns Hopkins, donde pudimos encontrar series temporales de casos confirmados en Francia del 22 de enero al 16 de marzo.

Ajuste en los datos hasta el 8 de marzo y pruebas posteriores en los datos del 8 al 16 de marzo

Aprendemos nuestro modelo sobre los datos observados hasta el 8 de marzo, es decir, estimamos el valor de λ y la forma de μ (.). Para verificar si nuestro modelo es correcto, simulamos la evolución del brote del 8 al 16 de marzo de acuerdo con nuestro modelo, luego comparamos lo que le da al HP con los datos reales.

La Figura 1 muestra la comparación entre la simulación y los datos reales:

La Figura 1 muestra que el modelo capta la tendencia global de la evolución del brote y valida nuestro enfoque, incluso si no es perfectamente preciso. Al 16 de marzo, la estimación del número de casos es de 5.208,96, mientras que el número real de personas infectadas es de 6.130. Sin embargo, la dinámica entre nuestro modelo y los datos reales es la misma, con un crecimiento exponencial del número de infectados.

Pudimos observar en la Figura 2 las curvas de la intensidad estimada y la evolución del número de casos, del 26 de febrero al 16 de marzo:

Vemos que los picos de intensidad corresponden a los momentos en que la velocidad de propagación es mayor. Viceversa, se ralentiza cuando la intensidad es baja.

Observación: el total de 6.130 casos del 16 de marzo podría parecer relativamente bajo en comparación con los 67 millones de personas en Francia. Pero enfoquemos 1 / λ * (.) En lugar de λ * (.). 1 / λ * (.) Representa el tiempo entre dos infecciones y se representa en la Figura 3:

Vemos que el 16 de marzo (la última observación), el tiempo entre llegadas es muy bajo: ¡aparece un nuevo caso cada 52 segundos! Sin embargo, es una tasa instantánea, el número promedio real debería ser más de alrededor de 2 o 3 minutos. Pero aún así, es dramático porque recordamos que solo hay 5.000 camas de cuidados intensivos disponibles en Francia. Sin una acción inmediata, el sistema de salud estará totalmente abrumado.

Simulación hasta el 26 de marzo.

Es la parte más interesante (y aterradora). Nos permite tener una estimación del número de infecciones, en diez días (jueves 26 de marzo). Nos centramos en dos escenarios: o la dinámica del brote sigue siendo la misma, o los franceses cambian sus hábitos sociales de acuerdo con las medidas adoptadas por el gobierno francés.

Escenario 1: la dinámica sigue siendo la misma

En un primer escenario, estimamos la cantidad de infecciones, si la dinámica del brote sigue siendo la misma, en diez días (jueves 26 de marzo), es decir, si los franceses no cambian sus interacciones sociales en las últimas semanas de Marzo.

Escenario 2: la población francesa respeta las medidas de cuarentena

En un segundo escenario, suponemos que la población francesa sigue las medidas tomadas por el gobierno francés el 17 de marzo (cuarentena). Para tener en cuenta estas decisiones, adaptamos nuestro modelo HP en una forma no lineal:

donde t_m es el momento en que se toman las medidas (es decir, 16 de marzo). Este modelo permite que la función de intensidad condicional disminuya de t_m, gracias a la parte inhibidora min [1, (t / t_m) ^ a]. Este es un parámetro aprendido de la evolución del brote en China, donde las cuarentenas fueron eficientes y ralentizaron el brote.

Observamos en la Figura 4 la comparación entre los dos escenarios:

Muestra que tomar medidas que respeten las medidas de cuarentena reduciría significativamente el número de casos estimados. Obtenemos un número estimado de casos de 51,642 casos en el primer escenario, y 14,621 casos en el segundo escenario, ¡aproximadamente tres veces menos! Además, vemos que la evolución del brote sin modificación de las interacciones sociales confirma la tendencia estimada por muchos otros modelos: el número de casos se duplicaría cada tres días.

Una observación importante: los datos en los que hemos trabajado son solo el número de casos oficiales. Podríamos pensar razonablemente que el número real de casos es mucho mayor, porque los hospitales no tienen suficientes médicos y material para evaluar a todas las personas que deseen. Tener síntomas de COVID-19 no es suficiente para ser probado. Según Worldometers, se realizaron 11.895 pruebas en la población francesa el 9 de marzo, para 1.209 casos oficiales, es decir, una tasa del 10,1% de pruebas positivas. Supongamos que esta tasa es la misma para nuestra simulación. Significa que se habrían realizado 51,642 / 10.1% = 511,306 pruebas, ¡es decir solo el 0.7% de la población! En consecuencia, el número real de casos sería mucho mayor que nuestro número estimado. Es difícil de cuantificar, pero podríamos imaginar que los médicos solo podrían centrarse en un caso de 3, un caso de 5 o incluso uno de 10.

Para más detalles

Puede ver nuestro artículo sobre este tema, que detalla los pasos principales del método (ajuste, back-testing, etc.) y se centra en los aspectos matemáticos del modelo.

Conclusión

Como conclusión, nuestro modelo con HP muestra que COVID-19 parece tener una dinámica autoexcitante. Las simulaciones confirman que la evolución del brote es exponencial si las personas no cambian sus hábitos, y que podría reducirse significativamente si se toman medidas similares a las de China. Todos deberían ser conscientes de la gravedad de la situación y adoptar las medidas tomadas por el gobierno para disminuir el brote.