Original size 1140x1600

Анализ датасета о Drake

PROTECT STATUS: not protected

Для проекта по анализу данных я выбрал датасет о Дрейке, потому что это мой любимый репер. Его музыка всегда вдохновляет меня, и я считаю, что его тексты песен, стиль и влияние на индустрию заслуживают глубокого анализа. Дрейк — один из самых успешных и популярных артистов современности, и его творчество охватывает множество тем, от личных переживаний до социальных вопросов. Это делает его тексты богатым материалом для анализа.

В качестве анализируемого материала я выбрал базу данных Drake Lyrics с сайта Kaggle.

В датасете содержатся тексты песен с сайта Genius.

В ходе анализа датасета я посчитал наиболее наглядными следующие виды графиков.

Гистограмма Круговая диаграмма Линейный график

1. Часто используемые слова

big
Original size 1189x590

Здесь можно увидеть что музыка Дрейка довольно коммерческая и представляет некий поп рэп, поэтому в текстах мало ругательств, а много, например слова любовь.

2. Песни с самым большим количеством слов

big
Original size 998x590

Тут можно заметить что его песни по количеству слов в целом схожи и имеют относительно одинаковое количество слов в треке. Это может говорить например о том, что его треки заточены под телевизионные и радио форматы, с определенными требованиями.

3. 5 самых длинных слов

Original size 990x390

Анализ же самых длинных слов может натолкнуть на мысли, что автор так же не забывает и рефлексировать на серьезные темы, а не только пишет песни «для толпы».

4. Количество слов в альбоме

Original size 1389x790

Оценив такой график можно сказать что альбомы с наибольшим количество слов не так популярны, как остальные. Исключение только альбом Scorpions.

https://disk.yandex.ru/d/zMwHJ09NbHAp-g

датасет и блокнот

Анализ датасета о Drake