Original size 1140x1600

Анализ лирики Тейлор Свифт

PROTECT STATUS: not protected
The project is taking part in the competition

Let the games begin!

Taylor Swift

big
Original size 3528x1732

Концеция

Тейлор Свифт стала для меня артисткой, чьи песни сопровождали разные этапы жизни и часто совпадали с личными переживаниями. В её текстах много внимания уделяется чувствам, внутренним конфликтам и процессу взросления. Через образы и эмоции формируется ощущение диалога с собой и слушателем, где важно не только событие, но и то, как оно проживается.

Вдохновением для проекта стал концертный тур The Eras Tour Тейлор Свифт, который объединяет разные периоды её карьеры в одном пространстве и времени. Это подтолкнуло меня взглянуть на её творчество целостно и попробовать проанализировать тексты песен с точки зрения данных. Мне интересно увидеть, какие слова и темы повторяются чаще всего, как меняется эмоциональный фон и какие мотивы остаются ключевыми на протяжении всего творчества.

big
Original size 3000x3000

Визуальный стиль эры Reputation в The Eras Tour

Музыка Тейлор Свифт охватывает разные этапы жизни и эмоциональные состояния, от наивных и романтичных до более сложных и рефлексивных. В её текстах часто повторяются мотивы памяти, расставаний, внутреннего диалога и переосмысления прошлого, что делает их близкими и узнаваемыми для многих слушателей и меня. Именно это разнообразие и последовательность изменений побудили меня взглянуть на её творчество не только как на музыку, но и как на материал для анализа.

Это подтолкнуло меня к идее проанализировать тексты песен с точки зрения данных и проследить, какие темы и образы остаются ключевыми на протяжении всего творчества. В качестве материала для анализа в проекте используется база данных с текстами песен Тейлор Свифт, на основе которой строятся визуализации и выводы, взятые с платформы Kaggle, но, к сожалению, файл был немного поврежден и содержал излишние данные, поэтому пришлось его редактировать и доводить до ума.

В ходе анализа данных для визуализации я решил сгенерирвать такие виды графиков как:

  1. Столбчатые диаграммы
  2. Линейные графики
  3. Круговые диаграммы
  4. Облака слов
Original size 2060x280

Цветовая палитра эры

Цветовая палитра проекта была собрана с помощью сервиса Adobe Color и основана на визуальной эстетике эры Reputation в концертном туре The Eras Tour. Эта часть шоу отличается тёмной, контрастной и напряжённой визуальной подачей, которая хорошо отражает более жёсткий и закрытый образ Тейлор Свифт в этот период её творчества.

При выборе оттенков я ориентировался на сценические образы, световое оформление и общее настроение эры Reputation, где преобладают чёрный цвет и резкие акценты. Использование тёмного фона и контрастных цветов делает визуализации более цельными и связывает их с выбранной музыкальной эпохой.

Процесс работы и графики

Перед началом работы с визуализациями я подготовил рабочую среду: импортировал необходимые библиотеки, загрузил файл с данными и проверил его структуру в соответствии с установочными требованиями. Этот этап был важен, чтобы убедиться, что данные корректно считываются и готовы к дальнейшему анализу, а все последующие графики будут построены на надёжной основе.

Original size 1380x696

Код установки библиотек и импорта данных

Столбчатые диаграммы

В первую очередь я решил посмотреть, как распределяются песни Тейлор Свифт по альбомам. Для этого я использовал столбчатую диаграмму, так как она позволяет без искажений сравнить количество треков в разных релизах. Я сгруппировал данные по альбомам и посчитал число уникальных песен в каждом из них, после чего отобразил результаты на графике. Такой формат я выбрал, потому что он сразу показывает различия между альбомами и помогает понять общую структуру дискографии, не навязывая интерпретаций.

Original size 976x490
Original size 1110x1272

Код для генерации диаграммы количества песен в альбмах

По диаграмме видно, что основные студийные альбомы Тейлор Свифт имеют сопоставимое количество песен и занимают большую часть всей дискографии. Сборники, демо-записи и EP заметно уступают им по объёму и представлены гораздо скромнее. Я делаю акцент на этом различии, потому что оно показывает, что именно полноформатные альбомы являются для Тейлор Свифт основным способом высказывания, тогда как остальные релизы скорее дополняют её творчество, а не формируют его основу.

После анализа количества песен в каждом альбоме я перешёл к сравнению объёма текстов. Для этого я сгруппировал данные по альбомам и посчитал количество строк текста, приходящихся на каждый из них. Затем я отсортировал результаты и представил их в виде столбчатой диаграммы, чтобы наглядно сравнить альбомы между собой. Я выбрал такой формат визуализации, поскольку он позволяет без дополнительных пояснений увидеть различия в насыщенности текстов и понять, где лирика играет более заметную роль, а где она выглядит более сдержанной.

Original size 989x490
Original size 1160x876

Код для генерации диаграммы количества строк текста в альбмах

Диаграмма показывает, что наибольший объём текстов сосредоточен в альбомах, относящихся к ключевым этапам карьеры Тейлор Свифт. В этих релизах количество строк заметно выше, что указывает на более детальную и развернутую работу с текстом. Я обращаю внимание на это различие, потому что оно помогает понять, что именно основные альбомы становятся пространством для сложных историй и личных высказываний, тогда как сборники и дополнительные релизы выполняют скорее поддерживающую роль и остаются более компактными.

Далее я решил посмотреть, как в разных альбомах используются отдельные слова. Для этого я выбрал несколько простых и часто встречающихся слов и посчитал, как часто они появляются в текстах каждого альбома. Такой подход позволяет нейтрально зафиксировать различия в лексике между релизами. Я выбрал именно этот тип визуализации, потому что он помогает проследить, как со временем меняется язык песен и какие темы в разные периоды становятся более заметными.

Original size 989x490
Original size 1412x1200

Код для генерации диаграммы частоты выбранных слов по альбомам

График показывает, что одни и те же слова распределяются по альбомам неравномерно. В ранних и более поп-ориентированных релизах чаще встречаются слова, связанные с любовью и романтическими переживаниями, такие как love и heart. В более поздних альбомах их частота снижается, а лексика становится более сдержанной и точечной. Я делаю на этом акцент, потому что такое распределение наглядно отражает изменения в том, как Тейлор Свифт говорит о чувствах и как со временем трансформируется её авторский язык.

Круговая диаграмма

После анализа столбчатых диаграмм я перешёл к более обобщённому представлению данных и построил круговую диаграмму. В ней я выделил пять альбомов с наибольшим количеством песен, а остальные объединил в категорию «Другое». Я выбрал такой формат, потому что он позволяет сразу увидеть соотношение основных релизов и вспомогательных выпусков и упростить восприятие общей структуры дискографии.

Original size 597x484
Original size 1042x1128

Код для генерации диаграммы распределения песен по альбомам

Диаграмма показывает распределение песен между альбомами и позволяет увидеть, какие релизы занимают наибольшую долю в общей дискографии. Я делаю акцент на этом результате, потому что он подтверждает, что основная часть песен сосредоточена в нескольких крупных альбомах, тогда как сборники и дополнительные релизы выполняют скорее вспомогательную функцию и не формируют ядро творчества.

Линейный график

Затем я посмотрел, как менялось количество выпускаемых песен по годам, сгруппировав данные по году релиза. Линейный график позволяет нейтрально зафиксировать общую динамику и увидеть периоды роста и снижения активности. Я выбрал именно такой тип визуализации, потому что он хорошо показывает изменения во времени и помогает проследить, в какие годы Тейлор Свифт выпускала больше музыки, а когда делала паузы или ограничивалась небольшими релизами.

Original size 989x490
Original size 1194x876

Код для генерации диаграммы количества песен по годам релиза

График показывает, что количество выпускаемых песен по годам в целом остаётся относительно стабильным, но при этом заметны отдельные всплески и спады. Пики приходятся на годы выхода крупных альбомов, тогда как снижение активности совпадает с промежутками между релизами или переходными этапами. Я обращаю внимание на эту динамику, потому что она наглядно демонстрирует, что творчество Тейлор Свифт развивается не линейно, а через чередование периодов активной работы и осознанных пауз.

Облако слов

В завершение анализа я обобщил работу с текстами и посмотрел, какие слова в песнях Тейлор Свифт встречаются чаще всего в целом. Для этого я построил облако слов, предварительно очистив тексты от служебных элементов и повторов, чтобы зафиксировать именно наиболее значимые слова. Я выбрал этот формат, потому что он позволяет в сжатом виде показать общий языковой и эмоциональный фон творчества, а использование общей цветовой палитры и чёрного фона связывает визуализацию с остальными элементами проекта и делает её более выразительной.

0
0

Код для генерации облака слов

Результат показывает, что в лирике Тейлор Свифт чаще всего встречаются слова, связанные с чувствами, внутренними состояниями и личным переживанием, такие как love, know, feel и want. Это позволяет зафиксировать общий эмоциональный и тематический фон её текстов без привязки к отдельным альбомам или временным периодам. Я завершаю анализ именно этой визуализацией, потому что облако слов наиболее наглядно обобщает предыдущие наблюдения и, при этом, визуально выделяется среди остальных графиков, делая итог анализа более цельным и запоминающимся.

Заключение

Работа над проектом показала, что тексты песен Тейлор Свифт можно рассматривать не только как эмоциональные истории, но и как структурированный материал для анализа. Использование графиков и визуализаций помогло увидеть повторяющиеся темы, изменения в настроении и особенности лирики, которые сложно уловить при обычном прослушивании. Такой подход позволяет по-новому взглянуть на её творчество и заметить, как разные периоды карьеры связаны между собой.

Original size 2000x1333

Описание применения генеративной модели

Chat-GPT использовался для запросов, связанных с разработкой и оптимизацией компьютерного кода. 
 Adobe Color использовался для автоматического создания цветовой палитры, используя загруженное изображение в качестве основы.

Original size 1024x690