Un vistazo sobre el coronavirus

Soy nuevo en el mundo de la ciencia de datos, pero siempre me ha gustado. Por lo tanto, quiero implementar algunos de mis nuevos conocimientos que he obtenido del curso en línea y varias fuentes en línea en este artículo.

El brote de coronavirus ha sido un problema mundial desde hace unas semanas. La repercusión abarca muchos casos, como financieros, de propiedad, de vida, etc. Como probablemente haya sabido, es un nuevo virus respiratorio identificado por primera vez en Wuhan, China.

Figura 1. Coronavirus

Muchas gracias a Datakaggle.com que abre públicamente los datos. Nuestra sed de revelación se puede festejar. Usé Python para procesar y visualizar los datos. En primer lugar, importe las bibliotecas relevantes en la hoja de trabajo.

Figura 2. Importando la Biblioteca

Nada realmente elegante en la biblioteca que utilicé. en consecuencia, llamó a los datos solo para familiarizarse con las columnas y los tipos de datos. Como se ve en la imagen a continuación, el formato de fecha de la primera fila (índice = 0) y las otras filas (índice = 1 :) son diferentes. No he comprobado cómo va a afectar el procesamiento de datos, pero personalmente no considero esa apariencia. De aquí en adelante, lo convertí usando el análisis del módulo de dateutil.parser. También logré algunos valores faltantes (NaN) en las tablas, pero luego de probarlo, es solo un cero que se deja en blanco intencionalmente.

Figura 3. Procesamiento de datos

Tenía curiosidad por saber cuánto es la fluctuación de las víctimas confirmadas para China y no China. Deliberadamente divido esto en distintas variables porque quiero saber cómo responden y se comportan estos dos. Desde el 21 de enero, los números han aumentado rápidamente hasta que alcanzó su punto máximo el 2 de febrero (Nota: esto no es acumulación sino un registro diario)

Figura 4. La fluctuación de las víctimas confirmadas en ChinaFigura 5. La fluctuación de las víctimas confirmadas para Non_China

Para los no chinos, la cantidad de víctimas parece estar aumentando y alcanzó el pico el 31 de enero. Del gráfico (Figura 5), ​​los países más afectados están formando un patrón con sus altibajos. ¿Podría ser eso alguna correlación entre países? Bueno, lógicamente, ¡sí! El brote en un área podría extenderse potencialmente a los demás, especialmente a los países adyacentes.

Figura 6. Gráfico de barras de víctimas confirmadas

En el gráfico de barras anterior (Figura 6), se puede ver que la mayoría de las víctimas están en China. El brote de virus se extendió ampliamente por toda China. Es completamente entendible si Tailandia y Hong Kong dominan la primera y la segunda posición respectivamente, ya que esos países son colindantes entre sí. La misma regla se aplica a Malasia y Singapur.

Figura 7. El anexo de recovery_pace y death_pace

Mido el ritmo de recuperación y muerte en relación con las víctimas confirmadas (Figura 7). Bajo esa condición podemos crear una noción comparable y fructífera.

Figura 8. La gráfica de recuperación y ritmo de muerte para China

En el gráfico anterior, podemos ver que la iniciativa de recuperación se inició desde el 22 de enero y ha tenido éxito en reparar a las víctimas infectadas. No obstante, el ritmo de recuperación parece disminuir gradualmente, hasta el 26 de enero, la muerte superó el ritmo de recuperación. Es obvio que incluso el gobierno de China ha llevado a cabo una restauración importante, el virus ha afectado a China más rápido que eso.

Figura 9. El gráfico de recuperación y ritmo de muerte para no China

Lo que parece ser más intrigante es cómo se comportan los países que no son de China en este caso. El tratamiento se ha vuelto verde desde el 25 de enero. Dentro de este rango de tiempo, solo se registró una muerte en The Philipines (20/02/2020). El coronavirus ha sido tomado en serio por la mayoría de los países y ha sido un problema global desde el brote.

Figura 10. La comparación de víctimas confirmadas y recuperadas

La Figura 10 muestra cómo se compara el proceso de recuperación con las víctimas confirmadas. El gráfico no visualiza que el proceso de curación en Hubei es mucho mejor que el resto de la ciudad en China. Un número mayor no siempre significa mejor, en realidad tenemos que hacerlo en proporción. Sin embargo, deberíamos apreciar el esfuerzo de la ciudad por recuperarse.

Figura 11. El brote de Geomap del coronavirus

Por último, pero no menos importante, utilicé la plantilla desarrollada por Parul Pandey de Kaggle. De la Figura 11, podemos imaginar completamente qué continente está más dañado. Es evidente que Asia tiene la mayoría de los países infectados, seguida de Europa, América y Australia. En realidad, hay un caso en Costa de Marfil, no aparece en el mapa porque me caí de la mesa. Es bastante difícil encontrar la latitud y la longitud de Costa de Marfil. Por favor, perdona mi pereza. jaja. Tenga en cuenta que estos datos se recuperaron hasta el 2 de febrero, el resultado y la interpetración pueden diferir.

Espero que este EDA te ayude a comprender mejor lo que el coronavirus nos trae a todos. ¡Esperemos lo mejor!

¡Salud!