Original size 1140x1600

Анализ данных пандемии COVID-19

PROTECT STATUS: not protected

Концепция

Пандемия COVID-19, вызванная новым коронавирусом SARS-CoV-2, стала одним из самых значительных глобальных вызовов XXI века. С момента своего появления в конце 2019 года вирус быстро распространился по всему миру, затронув здоровье миллионов людей и оказав серьезное влияние на экономику, социальные структуры и повседневную жизнь.

Цель данной работы — провести комплексный анализ пандемии COVID-19 посредством использования COVID-19 Dataset, представленный на платформе Kaggle. Этот источник содержит в себе различные данные о людях, перенесших это заболевание. В работе будут рассмотрены диагарммы, предоставляющие информацию о данных пациентов.

big
Original size 1797x619

#Константы стиля

big
Original size 1374x536

Концепция визуалиазации основана на наиболее распространенной палитре и графических решениях, используемых для изображения пандемии COVID–19.

Обработка данных

Первым делом я импортировала необходимые мне для работы библиотеки: matplotlib, pandas, numpy seaborn. Далее считала скачанный csv-файл датасета.

Original size 1520x410

Визуализация данных

#1

0

Соотношение полов среди заболевающих

Представленная круговая диагармма показывает соотношение полов среди заболевающих. На ней наглядно показано, что количество мужчина и женщин практически одинаково.

#2

0

Тепловая карта корреляций между числовыми признаками

Данная тепловая диаграмма показывает то, насколько варьируется заражение эпидемией COVID-19 учитывая сопутствующие заболевания людей, такие как диабет, астма, сердечная недостаточность и т. д.

Original size 767x200

#3

0

Распределение пациентов по возрастным группам

Представленный выше график демонстрирует соотношение количества заболевающих с их возрастом. Как мы можем заметить, основная группа риска включает в себя людей среднего возраста, примерно от 30 до 50 лет.

#4

0

Динамика заболеваемости по месяцам

Данная диаграмма транслирует динамику количества случаев заболевания COVID-19 в соотношении с временными промежутками. Глядя на график можно сделать вывод о том, что основная концентрация заболеваемости пришлась на середину 2020 года.

Описание применения генеративной модели

В проекте я использовала нейросеть Recraft, чтобы сгенерировать обложку проекта. Промпт: Create an image of the coronavirus. The design should feature a detailed and visually striking representation of the virus, showcasing its characteristic spike proteins and spherical shape.

Библиография

COVID-19 Dataset. 2023. COVID-19 patient’s symptoms, status, and medical history. https://www.kaggle.com/datasets/meirnizri/covid19-dataset

Original size 1909x713
Анализ данных пандемии COVID-19