
Вводная часть: Почему именно киберспорт?
Киберспорт — это быстроразвивающаяся индустрия, объединяющая миллионы зрителей и участников по всему миру. В последние годы он вышел за пределы развлечений и стал важным социальным и экономическим феноменом. Меня заинтересовало изучить динамику популярности киберспорта и его основные показатели.
Что конкретно анализирую:
киберспортивные турниры
разные дисциплины (Dota 2, League of Legends, CS: GO, Valorant, Fortnite)
призовые фонды турниров
пиковую зрительскую аудиторию
изменение показателей во времени (2015–2024)
Почему выбран именно этот тип данных?
Для анализа популярности киберспорта я использовала открытые наборы данных с сайта HLTV, так как они предоставляют подробную статистику по турнирам и командам за длительный период.
Виды анализа и визуализации, которые были использованы
Для демонстрации трендов популярности киберспорта я использовала линейные графики. Для сравнения команд — столбчатые диаграммы. Распределение игроков по регионам — круговые диаграммы, что позволит наглядно показать доли.
Что я сделала для финальной работы?
Создала синтетический CSV esports_synthetic_tournaments.csv (турниры 2015–2024) с колонками: year, tournament, game, region, prize_pool_usd, peak_viewers, top_team.
Провела анализ в Pandas: группировки по году/игре, сводная статистика, annual summary.
Построила и стилизовала 4 разных графика (и сохранил их PNG):
Stacked bar — суммарный prize pool по годам и играм (тренд 2015–2024).
Boxplot + точки — распределение prize pool по играм (в тыс. USD).
Scatter (лог шкала по призу) — peak_viewers vs prize_pool, раскрашено по играм.
Horizontal bar — Top-10 турниров по prize pool.
Провела простую статистику: корреляция (Пирсон) между log (prize_pool) и peak_viewers.
Сгенерировала Jupyter-notebook (esports_esports_analysis.ipynb) с описанием методов и мини-кодом.
Описание применения нейросетей
В процессе работы над проектом использовалась генеративная нейросеть ChatGPT (модель: GPT-5 Thinking mini).
Цели использования нейросети:
Помощь в структурировании проекта (логика презентации, этапы анализа).
Генерация описаний графиков и формулировок выводов.
Подбор типов визуализаций под учебные задачи.
Формулировка объяснений статистических методов простым языком.
Помощь в стилизации графиков через код (цвета, шрифты, композиция).
Примеры использованных промптов:
«Составь структуру учебного проекта по анализу данных на тему киберспорта с использованием Pandas и визуализации.»
«Объясни простыми словами, что такое корреляция Пирсона и как её интерпретировать в контексте зрителей и призовых.»
«Предложи визуальный стиль для инфографики по киберспорту: цвета, шрифты, настроение.»
«Помоги сформулировать выводы по scatter-графику зрителей и призовых фондов.»
Роль нейросети в проекте:
Нейросеть использовалась как вспомогательный инструмент, но:
Все данные были проанализированы вручную в Python.
Все графики были построены кодом.
Все выводы были проверены логически и адаптированы под учебную задачу.
2. Стилизация графиков и визуальный стиль
Для визуализации был выбран киберспортивный инфографический стиль, вдохновлённый:
интерфейсами игровых турниров,
аналитикой Twitch и Esports Charts,
дашбордами игровых студий.
Основные принципы стилизации:
Единая цветовая палитра для каждой игры:
Dota 2 — синий
League of Legends — оранжевый
CS: GO — зелёный
Valorant — красный
Fortnite — фиолетовый
Единый шрифт, заданный через matplotlib.rcParams
Повышенная контрастность
Тонкие чёрные обводки у элементов
Минимальное количество лишних декоративных элементов
Подписи значений на ключевых столбчатых диаграммах
Как реализовано технически:
Все цвета заданы через словарь палитры в коде.
Все шрифты и размеры заданы через настройки matplotlib, а не в графическом редакторе.
Все графики сохранены в едином разрешении и стиле.
Таким образом, визуализация оформлена как единая инфографическая серия, а не как набор стандартных графиков Python.
3. Изучающий и объясняющий формат визуализации
Проект построен не только как демонстрация данных, но и как обучающий визуальный рассказ о развитии киберспорта.
Пример логики объяснения через графики: График 1 — Сложенная столбчатая диаграмма (stacked bar)
«Как менялся суммарный призовой фонд по годам и играм»
Итоговые графики (Киберспорт)
В проекте было построено 4 визуализации разных типов, каждая из которых отвечает на свой аналитический вопрос.
График 1 — Сложенная столбчатая диаграмма
«Как менялся суммарный призовой фонд по годам и играм»
Показывает рост индустрии киберспорта во времени
Позволяет сравнивать вклад разных дисциплин
Объясняет:
какие игры формируют основную экономику,
какие дисциплины растут быстрее.


«Насколько нестабильны призовые в разных играх» — 2 график «Связаны ли деньги и популярность?» — 3 график
График 2 показывает:
медиану,
разброс,
экстремальные значения.
Позволяет объяснить:
почему в Dota 2 бывают огромные турниры,
почему в CS: GO и Valorant призовые более равномерны.
«Какие турниры формируют рекорды индустрии»
Формирует представление:
о масштабах крупнейших событий,
о разнице между «обычными» и «флагманскими» турнирами.
Таким образом, каждый график:
не просто визуализирует цифры,
а отвечает на конкретный исследовательский вопрос.
Использованные статистические методы
1. Описательная статистика
Использовались:
среднее (mean),
медиана (median),
стандартное отклонение (std),
минимум и максимум.
Применение:
Анализ типичных и экстремальных размеров призовых.
Сравнение разных дисциплин между собой.
2. Группировка данных (groupby)
Использовалась для:
подсчёта числа турниров по годам,
вычисления суммарных призовых по играм,
расчёта средних показателей по дисциплинам.
Это позволило:
построить тренды,
создать агрегированные инфографики.
Ссылка на датасет и коды: https://drive.google.com/drive/folders/1XazGIbCmFYBfJqR9EANmv4C9r6Vdkykb?usp=drive_link