
В данном проекте визуализация данных используется для анализа изменений, происходивших в Олимпийских играх на протяжении длительного времени.
Обычно Олимпийские игры воспринимаются прежде всего как череда отдельных соревнований и рекордов, однако работа с данными позволяет взглянуть на них как на целостную систему, в которой со временем формируются устойчивые тенденции и структурные изменения.

Для исследования был использован открытый датасет, опубликованный на платформе Kaggle, содержащий информацию об олимпийских спортсменах, распределении медалей между странами, возрасте победителей и антропометрических данных в различных видах спорта. Набор данных даёт возможность сравнивать показатели в разные исторические периоды, выявлять крайние значения и анализировать различия между дисциплинами и странами.
В процессе работы основное внимание было сосредоточено на нескольких вопросах:
Как менялось общее количество участников Олимпийских игр с течением времени, какие страны накапливали наибольшее число медалей, в каком возрасте спортсмены чаще всего достигают высших результатов и насколько сильно отличаются требования к физическим параметрам в разных видах спорта.
Анализ был выстроен таким образом, чтобы через визуализацию данных показать общие закономерности, характерные для Олимпийских игр как долгосрочного спортивного явления.
Для визуального анализа были использованы следующие типы графиков:
1. Линейный график 2. Barchart 3. Точечная диаграмма с линией тренда 4. Lollipop Chart с двойной осью
Цветовая палитра
Основной шрифт проекта — Russo One, выбранный за его выразительность и спортивный характер.
Цветовое решение проекта напрямую отсылает к визуальной идентичности Олимпийских игр. В качестве основы была выбрана палитра, вдохновлённая олимпийскими кольцами. Каждый цвет ассоциируется с ключевыми ценностями Олимпиады.
Палитра была собрана и структурирована для дальнейшего использования в Adobe Color. Используемые цвета: #1F9AD7 #FFD700 #2B2B2B #0A9E4A #C72E2E
То, как видит тему моего проекта нейросеть promt: Create an image that represents the Olympic Games.
Использованные статистические методы
В ходе анализа данных были применены методы описательной и разведочной статистики:
1. Описательная статистика
— использовалась для агрегирования количества олимпийских спортсменов по десятилетиям и полу. Это позволило количественно оценить динамику участия мужчин и женщин в Олимпийских играх на протяжении длительного исторического периода.
2. Анализ временных паттернов
— реализован с помощью линейных графиков, отражающих изменение численности спортсменов по десятилетиям. Такой подход позволил выявить долгосрочные тенденции роста и изменения гендерной структуры олимпийского движения.
3. Сравнительный анализ групп
— применялся для сопоставления мужской и женской групп спортсменов по временным интервалам, что позволило наглядно оценить различия в динамике их представительства.
4. Структурный анализ
— использовался при анализе распределения олимпийских медалей по странам и типам наград (золото, серебро, бронза). Стековая столбчатая диаграмма позволила одновременно оценить как общий объём медалей, так и вклад каждого типа награды.
5. Ранжирование категорий
— реализовано путём отбора стран с наибольшим суммарным числом медалей, что позволило выделить лидеров олимпийского движения и сравнить их структуру достижений.
6. Визуальный анализ взаимосвязей
— выполнен с помощью диаграммы рассеяния, отображающей зависимость возраста спортсменов от года получения золотой медали. Это позволило исследовать возможные изменения возрастного профиля чемпионов во времени.
7. Трендовый анализ
— проведён с использованием линейной регрессионной аппроксимации, что позволило выявить общую тенденцию изменения возраста золотых медалистов на протяжении рассматриваемого периода.
8. Агрегирование и сравнительный анализ признаков
— применялся при расчёте средних значений роста и веса спортсменов по видам спорта. Это позволило выявить характерные антропометрические профили различных спортивных дисциплин.
9. Многомерный сравнительный анализ
— реализован с помощью парных сравнений (slopegraph), что позволило наглядно сопоставить средние значения роста и веса внутри каждого вида спорта и оценить различия между дисциплинами.
График 1
Первый график демонстрирует изменение количества олимпийских спортсменов по десятилетиям с разделением по полу. Визуализация ясно показывает, что в начале XX века Олимпийские игры были практически полностью мужским пространством. Однако со временем участие женщин стабильно росло, особенно заметно ускорившись во второй половине века. Это отражает постепенные изменения в спортивной политике и расширение гендерного равенства в международных соревнованиях.
Количество олимпийских спортсменов по десятилетиям (с разделением по полу)
График 2
Вторая визуализация посвящена сравнению стран по общему количеству завоёванных олимпийских медалей. Столбчатая диаграмма с разбивкой по типам наград позволяет увидеть не только лидеров, но и структуру их успеха.
График 3
Точечный график отражает возраст спортсменов, завоевавших золотые медали, в разные годы проведения Олимпийских игр. Несмотря на значительный разброс значений, общая линия тренда указывает на небольшое смещение среднего возраста вверх. Это может быть связано с ростом профессионализма спорта, развитием медицины и увеличением продолжительности спортивной карьеры.
Во сколько лет можно получить своё «золото»?
График 4
Заключительный график посвящён сравнению среднего роста и веса спортсменов в различных олимпийских дисциплинах. Формат графика позволяет легко сопоставить физические параметры и выявить контраст между видами спорта, где доминируют мощные антропометрические данные, и дисциплинами, в которых решающую роль играют гибкость, координация и техника.
На сколько большие и маленькие разные спортсмены
Заключение
Анализ данных показывает, что Олимпийские игры со временем значительно увеличивались в масштабе. Количество спортсменов по десятилетиям росло неравномерно, однако в целом прослеживается устойчивая тенденция к расширению числа участников.
Сравнение стран по количеству медалей выявляет концентрацию наград у ограниченного числа государств, которые на протяжении длительного времени сохраняют лидирующие позиции. Большинство остальных стран представлены заметно меньшим объёмом достижений. Рассмотрение возраста золотых медалистов показывает, что высшие спортивные результаты чаще всего достигаются в относительно стабильном возрастном диапазоне, при этом наблюдается постепенное увеличение среднего возраста победителей. Анализ физических параметров спортсменов подчёркивает значительные различия между видами спорта. Требования к росту и весу существенно варьируются в зависимости от дисциплины, что отражает специфику подготовки и соревновательной деятельности.
В результате проект показывает, что статистические данные являются важным инструментом для понимания истории и устройства Олимпийских игр, а визуальные формы представления позволяют увидеть закономерности, которые остаются незаметными при традиционном анализе таблиц.
Описание применения генеративной модели и вспомогательных инструментов
1. Google Colab — Весь процесс работы: обработка данных и визуализация.
2. Kaggle — Платформа была использована для поиска и загрузки датасета.
3. Цветовая палитра (Adobe Color)
4. Библиотеки Python pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте. numpy — для расчёта трендовых линий и математических операций. kagglehub — для автоматического скачивания датасета matplotlib.font_manager — для подключения кастомного шрифта
5. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.
6. recraft.ai (https://www.recraft.ai/projects) — Использовала для генерации обложки и иллюстраций.