Original size 851x1180

Анализ музыкальных данных Spotify

PROTECT STATUS: not protected
The project is taking part in the competition

Введение

Для проекта был выбран датасет с музыкальными треками из Spotify за 2010–2019 годы с платформы Kaggle. Цель проекта — проанализировать музыкальные тренды последнего десятилетия через визуализацию данных. Я исследую популярные жанры и исполнителей, взаимосвязь характеристик треков и их эволюцию во времени. Проект поможет понять, как менялись музыкальные предпочтения и какие факторы влияют на популярность треков в Spotify

Визуализация и стилистическое решение

Я остановилась на фирменной тёмной теме Spotify с использованием различных оттенков зелёного на чёрном фоне для создания стилистического единства и узнаваемости. Графики выполнены с высокой контрастностью: белый текст на тёмных фонах обеспечивает максимальную читаемость. Зелёные градиенты от светлых к тёмным оттенкам (1DB954 →1aa34a) используются для визуальной иерархии и выделения важных данных.

Подготовка к построению графиков

Для проекта я использовала ключевые библиотеки Python: pandas для обработки табличных данных, numpy для математических операций и matplotlib для создания всех визуализаций. Дополнительно подключала requests для загрузки датасета напрямую из облачного хранилища. В начале кода была выполнена очистка данных, были преобразованы типы столбцов и отфильтрованы записи за период 2010–2019 годов. Далее я настроила тёмную цветовую палитру Spotify, которая единообразно применялась ко всем графикам посредством задавания цветовых параметров в коде.

График 1

Электронная танцевальная и поп музыка уверенно лидируют в списке, что отражает их коммерческое доминирование и глобальную популярность в 2010-е годы. Относительно небольшая доля акустических жанров указывает на сдвиг массовых предпочтений в сторону цифрового производства и клубного звучания.

0

Данная круговая диаграмма предоставляет интуитивно понятный изучающий формат, который позволяет мгновенно оценить пропорциональный вклад каждого жанра в выборку. Для её построения был применён базовый метод описательной статистики — частотный анализ категориальных данных.

График 2

Небольшой разрыв в количестве песен между лидерами показывает равномерное распределение популярности среди самых успешных артистов. В списке представлены как сольные исполнители, так и группы, что демонстрирует разнообразие востребованных форматов. Эти музыканты формировали ядро музыкального мейнстрима периода.

0

Горизонтальная столбчатая диаграмма представляет собой объясняющую визуализацию, где длина столбца точно соответствует количественному значению. Статистической основой послужил подсчёт абсолютных частот с последующим ранжированием полученных значений по убыванию.

График 3

Слабая положительная корреляция свидетельствует о том, что танцевальность является лишь одним из многих факторов популярности, а не её гарантией. Широкий разброс точек на графике подтверждает, что хитами становятся треки с самыми разными характеристиками. Наличие в верхней части графика треков с невысокой танцевальностью подчёркивает важность других качеств, таких как мелодичность или лирика.

0

Эта точечная диаграмма служит инструментом изучающего анализа, основной задачей которого является поиск и демонстрация взаимосвязей между двумя непрерывными переменными. Для проверки гипотезы о связи был рассчитан коэффициент линейной корреляции Пирсона.

График 4

Устойчивый рост показателя «энергии» и спад «акустичности» визуально подтверждают глобальный тренд на цифровизацию и повышение интенсивности музыки. Динамика «валентности» (позитивности) не показывает явного тренда, что может говорить о её зависимости от более сложных культурных контекстов разных лет. В целом, график показывает, что изменения характеристик происходили постепенно, а не скачкообразно.

0

Линейный график выбран как объясняющий формат, который идеально подходит для отображения тенденций и изменений метрик во времени. Для его построения данные были рассчитаны среднегодовые значения для каждой характеристики, что является методом анализа временных рядов.

Выводы

На основе визуализации данных Spotify за 2010–2019 годы можно заключить, что музыкальная индустрия этого периода характеризовалась доминированием цифровых жанров, равномерным распределением популярности среди топ-артистов и отсутствием прямой зависимости между отдельными характеристиками треков и их успехом. Наблюдается устойчивый тренд на усиление электронного звучания и снижение акустичности, что отражает общую эволюцию музыкального производства в сторону цифровизации. Полученные результаты демонстрируют, как методы визуализации данных позволяют выявлять скрытые закономерности и объективно анализировать культурные явления.

Описание применения генеративной модели

В рамках создания данного проекта использовался ИИ-ассистент DeepSeek https://www.deepseek.com для комплексной поддержки на различных этапах работы. Он помог с редактурой и оптимизацией кода Python, внедрением новых функций и детальным объяснением работы незнакомых библиотек визуализации данных. Также DeepSeek провёл экскурс по методам статистического анализа, помогал анализировать выводы графиков и находить интересные закономерности в данных, что существенно углубило исследовательскую составляющую проекта. Обложка проекта была сгенерирована с использованием сервиса Freepik https://www.freepik.com