
Для анализа я выбрала тему: «Как меняется качество воздуха в крупных городах и от чего оно зависит».

Описание проекта:
Для проекта был выбран датасет с измерениями качества воздуха в городах Индии, опубликованный на платформе Kaggle. Данные собирались на основе показаний экологических станций и содержат ежедневные измерения загрязняющих веществ.
Качество воздуха напрямую влияет на здоровье людей, уровень смертности и качество жизни. Индия — одна из стран с наиболее острыми проблемами загрязнения воздуха, поэтому данные: имеют высокую социальную значимость, отражают реальные экологические процессы, позволяют анализировать различия между городами и сезонами. Стоит отметить, что с недавних пор Индия стала моим личным интересом — поэтому я не могла упустить возможность изучить ее с еще одной стороны.

Я использовала один датасет, который хорошо отражает информацию, нужную мне для исследования.
Это набор данных , в котором каждая строка датасета соответствует одному дню наблюдений в конкретном городе. Датасет включает в себя 4 группы признаков: географические и временные данные, загрязняющие вещества, летучие органические соединения (VOC), интегральные показатели. Датасет представляет собой комплексный источник информации о состоянии атмосферного воздуха и позволяет провести глубокий, наглядный значимый анализ.
Набор данных был найден на интернет-ресурсе Kaggle.
Типы графиков: - линейные графики — анализ изменений во времени - столбчатые диаграммы — сравнение городов - гистограммы — распределение загрязнения - boxplot — выявление выбросов - тепловая карта — корреляция загрязнителей
Этапы работы
1 этап работы: загрузка и первичный анализ, очистка данных: экологические данные часто содержат пропуски, а медиана снижает влияние аномальных значений
2 этап: стилизация визуализации: идея визуального стиля - тёмные насыщенные цвета - ассоциация с дымом и смогом - минимализм без визуального шума источники вдохновения: - экологические отчёты WHO - инфографика The Guardian - Datawrapper environmental reports


График 1 — линейный график, изменение AQI во времени


график/пример кода
Данный линейный график отображает изменение индекса качества воздуха (AQI) во времени для выбранного города (например, Дели). По оси X отложена дата наблюдения, по оси Y — значение AQI. Этот график используется для анализа временной динамики загрязнения воздуха и позволяет: - выявить долгосрочные тренды (улучшается или ухудшается ситуация со временем); - обнаружить сезонность (повторяющиеся пики загрязнения); - увидеть экстремальные значения AQI, соответствующие периодам сильного смога.
График 2 — столбчатая диаграмма, средний AQI по городам


график/пример кода.
Столбчатая диаграмма отражает среднее значение AQI для каждого города за весь период наблюдений. Каждый столбец соответствует отдельному городу. Этот график используется для сравнительного анализа между городами и позволяет: - определить, в каких городах воздух в среднем наиболее загрязнён; - выявить географические различия в качестве воздуха; - сформировать рейтинг городов по уровню загрязнения. Столбчатая диаграмма наглядно подходит для сравнения агрегированных показателей между категориями (городами) и легко интерпретируется.
График 3 — Гистограмма, распределение PM2.5


график/пример кода
Гистограмма отображает распределение значений концентрации PM2.5 — одного из наиболее опасных загрязняющих веществ. По оси X — концентрация PM2.5, по оси Y — количество наблюдений. Этот график позволяет: - понять, какие значения PM2.5 встречаются чаще всего; - оценить, насколько часто фиксируются опасные уровни загрязнения; - определить, является ли распределение симметричным или имеет длинный «хвост» экстремальных значений. Гистограмма помогает перейти от отдельных измерений к пониманию общей картины загрязнения воздуха и показывает, является ли высокий уровень PM2.5 редким или типичным явлением.
График 4 — Boxplot, AQI по категориям качества


график/пример кода
Boxplot визуализирует распределение значений AQI внутри каждой категории качества воздуха (Good, Moderate, Poor, Very Poor, Severe). Этот график позволяет: - сравнить диапазоны значений AQI между категориями; - выявить перекрытия и выбросы; - оценить, насколько корректно категории отражают реальные числовые значения. Этот график особенно полезный для анализа экологических данных с выбросами.
График 5 — Тепловая карта корреляций


график/пример кода
Тепловая карта отражает корреляции между концентрациями загрязняющих веществ и AQI. Цвет ячеек показывает силу и направление связи. Этот график помогает: - определить, какие загрязнители сильнее всего связаны с ростом AQI; - выявить взаимосвязи между разными веществами; - сделать выводы о ключевых факторах ухудшения качества воздуха.
Выводы:
В рамках данного проекта было проведено исследование изменений качества воздуха в крупных городах Индии и факторов, влияющих на его формирование. Для анализа использовались ежедневные данные измерений загрязняющих веществ, собранные экологическими станциями мониторинга и представленные в открытом доступе на платформе Kaggle. В результате проведённого анализа можно сделать вывод, что качество воздуха в крупных городах Индии формируется под влиянием совокупности факторов, среди которых ключевую роль играют концентрации мелкодисперсных частиц, сезонные изменения и локальные особенности городской среды. Проблема загрязнения воздуха носит системный характер и требует комплексного подхода как на уровне отдельных городов, так и на уровне государственной политики. Социальная значимость данной темы, а также личный исследовательский интерес к Индии, позволили рассмотреть проблему качества воздуха не только с технической точки зрения анализа данных, но и в более широком контексте влияния окружающей среды на качество жизни и здоровье населения.