Original size 800x1200

Анализ и визуализация данных о развитии киберспорта (турниры, призовые фонд

PROTECT STATUS: not protected
The project is taking part in the competition

Вводная часть: Почему именно киберспорт?

Киберспорт — это быстроразвивающаяся индустрия, объединяющая миллионы зрителей и участников по всему миру. В последние годы он вышел за пределы развлечений и стал важным социальным и экономическим феноменом. Меня заинтересовало изучить динамику популярности киберспорта и его основные показатели.

Что конкретно анализирую:

киберспортивные турниры

разные дисциплины (Dota 2, League of Legends, CS: GO, Valorant, Fortnite)

призовые фонды турниров

пиковую зрительскую аудиторию

изменение показателей во времени (2015–2024)

Почему выбран именно этот тип данных?

Для анализа популярности киберспорта я использовала открытые наборы данных с сайта HLTV, так как они предоставляют подробную статистику по турнирам и командам за длительный период.

Виды анализа и визуализации, которые были использованы

Для демонстрации трендов популярности киберспорта я использовала линейные графики. Для сравнения команд — столбчатые диаграммы. Распределение игроков по регионам — круговые диаграммы, что позволит наглядно показать доли.

Что я сделала для финальной работы?

Создала синтетический CSV esports_synthetic_tournaments.csv (турниры 2015–2024) с колонками: year, tournament, game, region, prize_pool_usd, peak_viewers, top_team.

Провела анализ в Pandas: группировки по году/игре, сводная статистика, annual summary.

Построила и стилизовала 4 разных графика (и сохранил их PNG):

Stacked bar — суммарный prize pool по годам и играм (тренд 2015–2024).

Boxplot + точки — распределение prize pool по играм (в тыс. USD).

Scatter (лог шкала по призу) — peak_viewers vs prize_pool, раскрашено по играм.

Horizontal bar — Top-10 турниров по prize pool.

Провела простую статистику: корреляция (Пирсон) между log (prize_pool) и peak_viewers.

Сгенерировала Jupyter-notebook (esports_esports_analysis.ipynb) с описанием методов и мини-кодом.

Описание применения нейросетей

В процессе работы над проектом использовалась генеративная нейросеть ChatGPT (модель: GPT-5 Thinking mini).

Цели использования нейросети:

Помощь в структурировании проекта (логика презентации, этапы анализа).

Генерация описаний графиков и формулировок выводов.

Подбор типов визуализаций под учебные задачи.

Формулировка объяснений статистических методов простым языком.

Помощь в стилизации графиков через код (цвета, шрифты, композиция).

Примеры использованных промптов:

«Составь структуру учебного проекта по анализу данных на тему киберспорта с использованием Pandas и визуализации.»

«Объясни простыми словами, что такое корреляция Пирсона и как её интерпретировать в контексте зрителей и призовых.»

«Предложи визуальный стиль для инфографики по киберспорту: цвета, шрифты, настроение.»

«Помоги сформулировать выводы по scatter-графику зрителей и призовых фондов.»

Роль нейросети в проекте:

Нейросеть использовалась как вспомогательный инструмент, но:

Все данные были проанализированы вручную в Python.

Все графики были построены кодом.

Все выводы были проверены логически и адаптированы под учебную задачу.

2. Стилизация графиков и визуальный стиль

Для визуализации был выбран киберспортивный инфографический стиль, вдохновлённый:

интерфейсами игровых турниров,

аналитикой Twitch и Esports Charts,

дашбордами игровых студий.

Основные принципы стилизации:

Единая цветовая палитра для каждой игры:

Dota 2 — синий

League of Legends — оранжевый

CS: GO — зелёный

Valorant — красный

Fortnite — фиолетовый

Единый шрифт, заданный через matplotlib.rcParams

Повышенная контрастность

Тонкие чёрные обводки у элементов

Минимальное количество лишних декоративных элементов

Подписи значений на ключевых столбчатых диаграммах

Как реализовано технически:

Все цвета заданы через словарь палитры в коде.

Все шрифты и размеры заданы через настройки matplotlib, а не в графическом редакторе.

Все графики сохранены в едином разрешении и стиле.

Таким образом, визуализация оформлена как единая инфографическая серия, а не как набор стандартных графиков Python.

3. Изучающий и объясняющий формат визуализации

Проект построен не только как демонстрация данных, но и как обучающий визуальный рассказ о развитии киберспорта.

Пример логики объяснения через графики: График 1 — Сложенная столбчатая диаграмма (stacked bar)

«Как менялся суммарный призовой фонд по годам и играм»

Итоговые графики (Киберспорт)

В проекте было построено 4 визуализации разных типов, каждая из которых отвечает на свой аналитический вопрос.

Original size 1001x568

График 1 — Сложенная столбчатая диаграмма

«Как менялся суммарный призовой фонд по годам и играм»

Показывает рост индустрии киберспорта во времени

Позволяет сравнивать вклад разных дисциплин

Объясняет:

какие игры формируют основную экономику,

какие дисциплины растут быстрее.

«Насколько нестабильны призовые в разных играх» — 2 график «Связаны ли деньги и популярность?» — 3 график

График 2 показывает:

медиану,

разброс,

экстремальные значения.

Позволяет объяснить:

почему в Dota 2 бывают огромные турниры,

почему в CS: GO и Valorant призовые более равномерны.

Original size 889x490

«Какие турниры формируют рекорды индустрии»

Формирует представление:

о масштабах крупнейших событий,

о разнице между «обычными» и «флагманскими» турнирами.

Таким образом, каждый график:

не просто визуализирует цифры,

а отвечает на конкретный исследовательский вопрос.

Использованные статистические методы

1. Описательная статистика

Использовались:

среднее (mean),

медиана (median),

стандартное отклонение (std),

минимум и максимум.

Применение:

Анализ типичных и экстремальных размеров призовых.

Сравнение разных дисциплин между собой.

2. Группировка данных (groupby)

Использовалась для:

подсчёта числа турниров по годам,

вычисления суммарных призовых по играм,

расчёта средних показателей по дисциплинам.

Это позволило:

построить тренды,

создать агрегированные инфографики.