Original size 1140x1600

Nirvana: анализ песен

PROTECT STATUS: not protected
32

О проекте

Группа Nirvana, ставшая символом поколения девяностых, оставила неизгладимый след в истории музыки. Творчество культовой группы продолжает вдохновлять миллионы слушателей и по сей день.

Через всю их дискографию красной нитью проходит эмоциональность и глубина в сочетании с бунтарским драйвом и необузданностью.

Анализ их композиций через статистику — подход, который позволяет взглянуть на любимую группу с новой стороны.

big
Original size 1920x707

Логотип Nirvana

Обложки альбомов «Bleach» и «In Utero», 1989 и 1993 гг.

Для основной цветовой палитры были использованы два нейтральных оттенка, взятых с обложки альбома Nirvana «Bleach», яркий желтый с логотипа группы и фоновый светлый цвет с обложки альбома «In Utero».

big
Original size 2565x404

Цветовая палитра: #1b1b12, #565851, #ffef00, #f6efb9

Работа с данными

Первым этапом работы стал выбор датасетов. Найденная база данных с текстами песен Nirvana (Nirvana Lyrics) была, безусловно, очень интересна для анализа, но мне показалось, что этого недостаточно, поэтому я добавила к ней базу данных с информацией о песнях различных гранж-групп (Grunge Bands Dataset). Оба датасета были найдены на сайте Kaggle.

Первой задачей стало объединение двух датасетов по наименованию песен (это также исключило песни других исполнителей из второго датасета, которые мне, очевидно, были не нужны в данном исследовании). Но во второй базе данных почти все треки повторялись несколько раз, так как там анализировались все их версии из всех альбомов, в том числе из сборников и разных вариаций живых записей концертов — это могло повлиять на статистику исследуемых мной данных (например, на частотность присутствующих в текстах слов).

Original size 2600x1200

Итак, следующей задачей стало удаление дубликатов песен.

Удаление дубликатов с учетом только названия трека мне не подходило, так как программа оставляла бы первую встреченную строку, а для меня данные о песне со студийного альбома были важнее, чем данные о той же песне с концертной live записи. При этом не у всех песен был вариант со студийной записью, так что удаление всех песен не со студийных альбомов тоже оказалось плохим вариантом.

Пришлось создать код, который определяет приоритет альбомов, группирует песни по названию, после чего к каждой группе применяет сортировку дублирующихся песен по установленной иерархии и уже потом возвращает первую строку («лучшую версию») среди дубликатов.

Original size 2600x880

Визуализация данных

После обработки объединенного датасета можно было приступать к визуализации.

График № 1

0

Первый график — стандартная гистограмма частотности слов, которые встречаются в песнях Nirvana. В базе данных тексты представлены в виде списка строк, так что сначала я провожу очистку и токенизацию текста, разбивая его на слова. Все слова я перевожу в нижний регистр и удаляю пунктуацию (это привело к тому, что слова с апострофами внутри остались без апострофов, но я предпочла этот вариант наличию лишних верхних одиночных кавычек в начале или конце слова). Я добавила фильтрацию по длине слова, чтобы избежать результата исключительно в виде самых частоупотребимых слов по типу личных местоимений и предлогов.

Original size 1189x590

Частое употребление think, could, something, would может свидетельствовать о том, что лирика Nirvana скорее о внутренних ощущениях, чем о фактах. Лирический герой чаще предполагает, чем знает. Упор на чувства выражается и в присутствующем в первой десятке happy.

Очень любопытно выглядит grandma, замыкающее первую тройку слов, но здесь объяснение довольно прозаическое: статистику сбила песня «Silver», в которой 43 раза звучит строчка «grandma take me home», а «бабушка» является неким прообразом матери.

График № 2

В изначальном втором (и, соответственно, в конечном объединенном) датасете есть колонка track_moods, отражающая настроение той или иной песни. Целью было выявление преобладающего в творчестве Nirvana настроения.

Original size 2600x1324

Я разделила строки на отдельные слова-индикаторы настроения, подсчитала их частотность и выбрала четыре самых часто встречающихся, подсчитав процентное соотношение их наличия по отношению ко всем трекам.

Выводом стало то, что в дискографии группы преобладает Angst-Ridden, Brooding, Visceral, Cathartic.

Original size 969x790

Agnst-Ridden (охваченный тревогой): настроение, пронизанное чувством тревоги, страха или беспокойства; отражает внутренние конфликты, страх перед будущим или эмоциональную нестабильность. Brooding (мрачный, задумчивый): настроение глубокой, часто мрачной задумчивости или меланхолии; песня может звучать тяжело, с акцентом на глубокую печаль, разочарование или внутренние терзания. Visceral (висцеральный, глубоко эмоциональный): настроение, которое передает эмоции настолько сильные, что они почти ощущаются на физическом уровне; произведение может быть интенсивным, эмоционально заряженным или даже грубым. Cathartic (катарсический, очищающий): настроение, которое приносит эмоциональное освобождение; песня может быть интенсивной, но в итоге оставляет чувство облегчения или умиротворения.

Это отлично передает то, чем пронизано все творчество Nirvana: эмоции, далеко не всегда положительные, но яркие, живые, иногда гранжево-грязные, будоражащие, вызывающие отклик в сердце.

График № 3

Original size 2600x1324

Следующий график — точечный, отражающий взаимосвязь межу параметрами danceability («танцевальность», то, насколько трек подходит для танцев) и energy («энергия», отражающая интенсивность, скорость, активность трека) у исследуемой выборки песен.

Original size 989x590

Общая положительная корреляция отсутствует, а значит, что энергичность песен группы не отражает то, насколько она подходит для танцев. При этом высокая энергия преобладает: в основном значения по этому параметру у песен не ниже 0.7, а вот в danceability разброс значений достаточно высок.

В целом по диаграмме можно сделать вывод, что Nirvana не стремились создавать музыку, подходящую для танцев: их творчество больше нацелено на драйв, ритм, энергию. Вместе с этим можно отметить, насколько разнообразные у группы есть треки: в их репертуаре есть как агрессивные, «роковые» композиции (кластер песен с высокой энергией и низким параметром танцевальности), так и более ритмичные, «мейнстримовые» песни (умеренная танцевальность, высокая энергия) или более спокойные, лиричные композиции (низкая энергия).

График № 4

Original size 2600x1324

Четвертый график, столбчатая диаграмма, отражает рейтинг альбомов. Альбомы расположены в хронологическом порядке.

Original size 1389x690

По графику можно заметить, как группа набирала популярность: пика Nirvana достигла с выходом альбома «In Utero». Так же высоко оценен и вышедший в год смерти Курта Кобейна концертный альбом «MTV Unplugged In New York»: судя по всему, поклонники и критики оценили способность группы в экспериментам и более лиричному исполнению: во время записи альбома Nirvana выступала в более камерной обстановке и под аккомпанемент акустических инструментов.

Заключение

Исследование выбранных датасетов помогло глубже проанализировать дискографию Nirvana. Некоторые предположения статистически подтвердились (как, например, высокий уровень энергичности большинства песен, свойственный жанру), некоторые результаты оказались неожиданными («grandma» в топ трех словах длиной не менее четырех букв).

Выявление доминирующего настроения композиций позволило лучше понять саму суть творчества группы — чувства, вложенные в него, от чего, как известно, зависят многие факторы от целевой аудитории до стиля, так как именно эмоции являются ядром любой музыки.

источник картинок (обложки альбомов, лого) — https://ru.wikipedia.org/wiki/Nirvana

Nirvana: анализ песен
32