Original size 1140x1600

Анализ текстов Radiohead

PROTECT STATUS: not protected
The project is taking part in the competition

Анализ текстов песен Radiohead

Radiohead — отличная группа для количественного анализа музыки: длительная карьера, резкие стилистические повороты и высокая историко‑культурная значимость позволяют отследить эволюцию звука и лирики на протяжении десятилетий. Мне было бы интересно проверять гипотезы: например, изменялась ли эмоциональная тональность песен вместе с ростом электронной составляющей.

Для визуализации был выбран датасет Radiohead Song Lyrics с сайта kaggle. Он содержит в себе текста всех треков группы, а также сортировку по альбомам.

Ход работы

Для визуализации данных были выбраны четыре типа графиков, исходя из оптимальности решения поставленных задач:

- Линейчатая диаграмма Используется для наглядного сравнения категориальных метрик по песням или альбомам. В контексте текстов это удобно для отображения топ‑наиболее частотных слов или тем (по шкале частоты), числа песен с определённой темой в каждом альбоме, а также для сравнения средней лексической разнообразности по альбомам.

- Гистограмма Применяется для показа распределения числовых показателей текстов: длины песен (количество слов), средней длины слова.

- Круговая диаграмма Эффективна для демонстрации пропорционального распределения дискретных категорий, например: процент песен по основным темам/тегам (из топ‑3–6 тем), доля песен с явно позитивным/нейтральным/негативным сентиментом или распределение песен по языковым формам (куплет/припев/бридж). Круговая диаграмма быстро показывает, чей вклад больше в общей картине тематического состава.

- Точечная диаграмма Идеальна для поиска и демонстрации зависимостей между двумя числовыми текстовыми показателями: например, длина текста vs. эмоциональная интенсивность, год релиза vs. средний сентимент куплета. Точечные диаграммы позволяют выявлять тренды — например, ослабление позитивности в определённые периоды или связь между более длинными лирическими текстами и большей семантической сложностью.

Визуальный стиль был вдохновлен альбомом OK Computer. Использованы неоново голубой и белый цвета (#00bfff, 0a0a0a), стилизованный шрифт (monospace)

Визуализация

Топ-15 самых длинных песен

Для начала с помощью кода удаляю «by Radiohead» из подсчета. Затем подсчитываю количество слов в каждой песне, составляя топ-15, а также среднее число слов.

Original size 1345x2003
Original size 1400x900

Диаграмма ясно показывает, что тройка песен с самым большим количеством слов значительно выделяется на фоне остальных: • «How To Disappear Completely» (362 слова) • «Street Spirit (Fade Out)» (357 слов) • «Lotus Flower» (351 слово) Эти композиции явно отличаются более развернутыми, детализированными или повторяющимися текстами. Их лирическое богатство, вероятно, способствует созданию глубокой, иногда медитативной или повествовательной атмосферы, характерной для этих треков. «How To Disappear Completely», например, известна своим пронзительным меланхоличным нарративом, где обилие слов помогает погрузить слушателя в состояние отстраненности и рефлексии.

В нижней части представленного топ-15 находятся «Daydreaming» (199 слов) и «Everything In Its Right Place» (198 слов). Эти цифры близки к среднему показателю по всем проанализированным песням (202 слова). Это особенно интересно для «Everything In Its Right Place», поскольку песня воспринимается как достаточно длинная и повторяющаяся. Ее позиция в конце этого списка указывает на то, что эффект продолжительности достигается не за счет большого разнообразия слов или обширного нарратива, а, скорее, за счет гипнотических повторений и музыкальной аранжировки. Это демонстрирует, что Radiohead умеют создавать глубокий эффект даже с ограниченным словарным запасом, полагаясь на атмосферу и повторяемость.

Распределение песен по альбомам

Original size 1200x1000

Выборка демонстрирует тройное лидерство ключевых альбомов в дискографии Radiohead: OK Computer, The Bends и In Rainbows они представляют собой половину от общего числа. Можно сделать вывод, что эти три работы отражают поворотные точки в творчестве группы, где каждая стала манифестом определённой эпохи.

Слова vs Символы по альбомам

0
Original size 1400x900

В правом верхнем углу — «A Wolf at the Door» с её нарративной насыщенностью, «The Bends» с социальным текстом, «Paranoid Android» с психоделическим многослойным повествованием. Эти композиции — не просто песни, а литературные произведения, где текст становится самостоятельным.

Левый нижний угол — представляет минимализм. «Feral» с её почти ритуальными повторами, «Motion Picture Soundtrack» с лаконичным текстом.

Распределение длины песен

0
Original size 1400x900

Основная масса песен (70-80% от общего количества) сосредоточена в интервале 50-200 слов. Эта «зона комфорта» представляет собой лирический хаб группы — пространство, где идея получает достаточное развитие, но не теряет эмоциональной остроты. Пик распределения вокруг 100-150 слов — это территория семантической плотности, где каждое слово работает на пределе своей выразительной силы.

Вывод

Делая вывод, можно сказать, что творчество Radiohead доказывает: даже в эпоху big data человеческое переживание остаётся неизмеримой величиной, но попытки его измерить (через подсчёт слов, символов, распределений) может помочь понять его сложность.

Данные не упрощают Radiohead — они делают их ещё более загадочными. Потому что каждая статистическая закономерность порождает новый вопрос: как группа, порой последовательная в формальных параметрах, остаётся абсолютно непредсказуемой в эмоциональном воздействии?

Описание применения генеративной модели

ChatGPT — генерация идеи для визуализации и обложки.

Deepseek — исправление ошибок в коде.

Ссылки