Original size 2375x3333

BTS Data Story

PROTECT STATUS: not protected

Вводная часть

Для анализа я выбрал датасет «BTS 147 Songs Audio Features (Spotify)» с платформы Kaggle. Данные собраны через Spotify API в ноябре 2021 года и содержат 147 песен с 17  аудиохарактеристиками: танцевальность, энергичность, громкость, акустичность, темп, валентность и другие.

big
Original size 4167x2165

фото участников группы BTS

BTS является одним из самых влиятельных музыкальных коллективов современности, чья дискография охватывает широкий спектр жанров — от хип-хопа до поп-баллад и EDM. Анализ объективных аудиопараметров позволяет выявить неочевидные закономерности и проследить эволюцию звучания группы вне субъективных оценок.

Цели и задачи

Цель: проанализировать аудиохарактеристики песен BTS и выявить тренды в эволюции их звучания.

Задачи: — Загрузить и подготовить данные из Spotify API — Построить графики для анализа динамики характеристик — Выявить корреляции между параметрами — Сравнить треки и альбомы между собой — Оформить всё в едином фиолетовом стиле BTS — Сформулировать выводы на основе полученных данных

Типы графиков

• Линейный график — эволюция характеристик по годам • Горизонтальная столбчатая диаграмма — топ-10 самых энергичных песен • Тепловая карта — корреляция аудиохарактеристик • Диаграмма рассеяния — танцевальность vs  позитивность • Круговая диаграмма — распределение песен по альбомам • Облако слов — частотность слов в названиях песен

Визуализация данных

Цветовое решение проекта продиктовано самой темой. BTS и их фандом ARMY неразрывно связаны с фиолетовым цветом — он стал символом связи между группой и поклонниками. Фраза «I  purple you» (я люблю тебя), придуманная участником V, превратила фиолетовый в цвет поддержки, доверия и единства.

Я хотела, чтобы визуальный стиль проекта отражал эту связь — фиолетовый должен был стать не просто случайным цветом, а смысловым ядром всей визуализации проекта.

Original size 1806x426

На этапе разработки визуального стиля я обратилась к ChatGPT с задачей подобрать цветовую гамму для проекта. Мой промпт звучал так:

«Предложи цветовую палитру для проекта о BTS. Нужны оттенки фиолетового — от тёмного до светлого. Фон должен быть чёрным или тёмно-фиолетовым. Цвета должны ассоциироваться с группой и фандомом ARMY. Нужно 5– 7 оттенков с кодами HEX.»

Original size 2748x1082

Я установила библиотеку kagglehub с поддержкой pandas для загрузки датасета напрямую с Kaggle, а затем импортировала все необходимые библиотеки: pandas для работы с табличными данными, numpy для математических расчётов, matplotlib и seaborn для построения графиков и тепловой карты, а также отключила предупреждения, чтобы вывод был чистым.

Я загрузила датасет с аудиохарактеристиками песен BTS напрямую с Kaggle через библиотеку kagglehub, используя адаптер для pandas, и вывела первые 5  строк, чтобы проверить, что данные загрузились корректно и посмотреть на структуру таблицы.

Original size 812x916

Я подготовила данные: добавила год релиза, перевела длительность в минуты, удалила дубликаты. Затем создала фиолетовую палитру и настроила стиль графиков под единое оформление.

График 1

Original size 2046x548

Линейный график показывает, как менялись танцевальность, энергичность, позитивность и акустичность с 2013 по 2021  год.

Результат: Пик энергичности и танцевальности — 2017– 2018 (эра Love Yourself). Акустичность снижается, позитивность растёт.

Original size 1189x589

Также видно, что акустичность со временем снижается, а позитивность, наоборот, растёт, особенно заметный скачок произошёл в 2020  году, вероятно, под влиянием альбома BE, который группа выпустила в пандемийный период с целью поддержать слушателей.

График 2

Original size 1912x548
Original size 1116x690

Второй график — зависимость между танцевальностью и позитивностью. Это диаграмма рассеяния, где каждая точка представляет отдельную песню. По горизонтальной оси отложена танцевальность, по вертикальной — позитивность. Цвет точек соответствует году релиза, а размер — энергичности трека. График показал, что жёсткой зависимости между этими двумя характеристиками нет. Песни с высокой танцевальностью могут быть как позитивными, например «Boy With Luv», так и грустными или тревожными, как «Fake Love» или «Black Swan». Также заметно, что более поздние годы (2020–2021) имеют больший разброс значений, что говорит о расширении жанрового диапазона группы.

График 3

Original size 1972x380
Original size 860x790

Третий график — распределение песен по альбомам. Это круговая диаграмма, которая показывает, какую долю в датасете занимает каждый альбом. Я подсчитала количество песен в каждом альбоме и визуализировала пропорции. Больше всего треков оказалось в альбомах «Love Yourself: Answer» — 20% и «BE» — 18%. Это объясняется тем, что «Answer» является компиляцией, объединяющей треки из двух предыдущих частей серии, а «BE» — полноформатным альбомом с большим количеством треков. «Love Yourself: Her» и «Map of the Soul: 7» также занимают значительную долю.

4 график

Original size 1190x590

Четвёртый график — распределение темпа песен BTS. Это гистограмма, которая показывает, в каком темповом диапазоне чаще всего работают авторы. По горизонтальной оси отложен темп в ударах в минуту (BPM), по вертикальной — количество песен. Я добавила вертикальные линии среднего и медианного значения. График показал, что большинство песен BTS находятся в диапазоне 80–140 BPM. Средний темп составляет 110 BPM, медиана — 108 BPM. Это подтверждает жанровое разнообразие группы: от медленных песен до быстрых и ярких танцевальных треков.

Облако слов

Пятый график — облако слов из названий песен BTS. Это дополнительная визуализация, которую я создала для завершения проекта. Облако слов показывает, какие слова чаще всего встречаются в названиях песен группы. Я обработала все названия, удалила стоп-слова (предлоги, артикли, общие слова вроде «the», «and», «for»), а затем визуализировала частотность: чем чаще слово встречается, тем крупнее оно отображается. Самыми частыми словами стали: love, soul, dream, light. Эти слова отражают ключевые темы творчества BTS — любовь, мечты, душаи свет.

Само облако я выполнила в форме сердца — символа фандома ARMY, а в центре разместила надпись BTS. Все слова окрашены в оттенки фиолетового, от тёмного к светлому, что поддерживает единый стиль проекта.

Original size 1189x1190

Заключение

Выбранные данные оказались содержательными и объёмными: 147 песен и 17 аудиохарактеристик позволили провести глубокий анализ эволюции звучания BTS с 2013 по 2021 год.

Я тщательно изучила данные: добавила год релиза, удалила дубликаты, провела корреляционный анализ, агрегировала данные по годам, рассчитала средние и экстремальные значения. Каждый график сопровождается содержательным выводом на основе цифр.

Что показали графики:

  1. Эволюция звучания — пик энергичности и танцевальности пришёлся на 2017–2018 годы (эра Love Yourself), акустичность снижается, позитивность растёт.

  2. Танцевальность и позитивность — жёсткой связи нет, песни с высокой танцевальностью могут быть как позитивными, так и грустными. Более поздние годы имеют больший разброс значений.

  3. Распределение по альбомам — больше всего треков в Love Yourself: Answer (20%) и BE (18%).

  4. Распределение темпа — большинство песен в диапазоне 80–140 BPM, средний темп 110 BPM.

Для стилизации я разработала уникальную фиолетовую палитру в цветах ARMY. Все графики выполнены на темно-фиолетовом фоне с белым текстом, цвета заданы кодом. Визуальное оформление выдержано в едином стиле.

Original size 464x580
Original size 1550x558
Original size 1386x548

участники группы BTS

Описание применения генеративной модели

Использованные модели: DeepSeek — https://chat.deepseek.com ChatGPT (OpenAI) — https://chat.openai.com

— ИИ помог написать код для всех графиков. При возникновении ошибок (например, KeyError: ’release_date’ или KeyError: ’album’) ИИ объяснил, какие колонки есть в датасете, и предложил правильные названия.

— Создание анимации логотипа DeepSeek и ChatGPT написали код для анимированного логотипа BTS с эффектами пульсации линий и текста, перелива фиолетовых цветов, вращающихся светящихся точек.

— Облако слов в форме сердца ИИ помог создать облако слов из названий песен в форме сердца с надписью BTS в центре, используя библиотеку wordcloud и маску сердца.

— Цветовая палитра По моему запросу ИИ предложил фиолетовую палитру в стиле BTS, объяснил выбор каждого цвета и помог настроить глобальный стиль matplotlib.

— Формулировка выводов и текстовое оформление ИИ помог структурировать выводы по каждому графику, написать вводную часть, описание этапов работы, заключение и оформить текст в соответствии с критериями презентации.

Искусственный интеллект выступал в роли технического ассистента: помогал писать и отлаживать код, предлагал стилистические решения, структурировал текст. Все ключевые решения — выбор датасета, постановка исследовательских вопросов, интерпретация полученных данных, итоговые выводы и общая концепция презентации — принимались мной самостоятельно.

BTS Data Story
Project created at 23.03.2026