Original size 1240x1750

Boston Run Marathon 2024

PROTECT STATUS: not protected
8

Анализ данных бегового марафона в Бостоне 2024: исследование временных показателей и их зависимостей

big
Original size 1456x816

Boston run marathon in blur, professional sport photo, James Garly style

Данный проект представляет собой анализ данных о бегунах, участвовавших в Бостонском беговом марафоне в 2024 году. Датасет был найден на Kaggle. В наборе данных содержится информация о 1000+ участниках, включая их возраст, пол, временные показатели на разных отрезках дистанции и другие параметры.

Почему беговой марафон?

В последнее время не только в нашей стране, но и по всему миру увеличивается количество людей, которые так или иначе следят за своим здоровьем и начитают заниматься спортом.

К 2024 году возник большой тренд на занятия бегом не только в любительском формате пробежки на улице, но и в профессиональном — марафонском забеге. Мне было бы интересно изучить этот тренд и узнать, действительно ли на забеге в Бостоне была значительная часть бегунов, которая присоединилась недавно. Проверить я это хочу с помощью временных показателей и их зависимости с другими характеристиками бегунов.

Почему эта тема интересно конкретно для меня? Мой молодой человек занимаемся бегом и в этом году мы ездили в Казань, где он принимал участие в полумарафоне. Лично мне спорт, конкретно бег, дается очень тяжело. Поэтому, мне кажется, что это исследование позволит мне чуточку больше погрузиться в тематику забегов и стать ближе к большой марафонской дистанции если не в качестве бегуна, то хотя бы в качестве исследователя.

Типы визуализаций:

Я старалась не просто обращаться к разным способам визуализации, но и старалась использовать действительно подходящий под каждый анализ тип визуализации. Так, в моем проекте есть: столбчатая диаграмма, точечная диаграмма, гистограмма обычная и с доджингом.

Этапы работы:

Загрузка данных

Мною были импортированы библиотеки, необходимые для анализа и визуализации данных: pandas, matplotlib.pyplot, seaborn, numpy, font_manager.

Original size 3840x1018

Константы стиля

Original size 1456x816

(рис. 1) running man in blur in marathon, professional sport photo, James Garly style --style raw

Далее мною были выбраны и определены фирменные константы для проекта — я подобрала шрифт, кеглевый ритм и цвета, которые будут использоваться при визуализации датасета.

В качестве главного цвета я выбрала ярко-салатовый оттенок, который ассоциируется у меня с движением и спортом. Меня вдохновила картинка, сгенерированная для этого проекта (рис. 1), на которой у одного спортсмена ярко-зеленая майка.

Original size 3840x2118
Original size 1456x816

(рис. 2) running tracks at the stadium in blur in marathon, professional sport photo, James Garly style

Также для визуализации данных я хотела найти стилистику, которая бы отражала спортивную наполненность датасета — так, главной метафорой визуализации стали беговые дорожки на стадионе.

В зависимости от типа визуализации оформление будет меняться, однако единый стиль будет сохраняться и не меняться от графика к графику.

— — — [СТАРТ] — — —

[01] Распределение участников марафона по полу и возрастным группам

Original size 3840x2596

[02] Распределение времени финиша по полу

Original size 3840x2596

[03]Средний положительный сплит по возрасту

Original size 3840x2596

[04] Динамика результатов по возрастным группам

Original size 3840x2596

[05] Сравнение результатов мужчин и женщин

Original size 3840x2596

[06] Распределение изменения темпа на дистанции

Original size 3840x2596

— — — [ФИНИШ] — — —

В заключение к проекту, я хочу отметить некоторые выводы по анализу данных:

— > большую часть участников марафона занимали мужчины в возрасте 20-39 лет

— > наблюдалась тенденция увеличения времени финиша с возрастом, где женщины в среднем финишировали лучше мужчин в своих возрастных группах

— > продолжая гендерные различия, женщины в среднем показывали более высокие результаты, но не очень значительные

— > у более молодых бегунов наблюдался более равномерный темп, что может указывать на лучшую тактику бега

- — -

— > мой личный вывод: заниматься спортом не поздно никогда. очень много людей добиваются высоких результатов. у других получается и я смогу!

Блокнот и ai

В проекте использовался deepseek для написания кода и midjourney для генерации изображений.

БЛОКНОТ С КОДОМ ЗДЕСЬ