
Для проекта по анализу данных я выбрал датасет о Дрейке, потому что это мой любимый репер. Его музыка всегда вдохновляет меня, и я считаю, что его тексты песен, стиль и влияние на индустрию заслуживают глубокого анализа. Дрейк — один из самых успешных и популярных артистов современности, и его творчество охватывает множество тем, от личных переживаний до социальных вопросов. Это делает его тексты богатым материалом для анализа.
В качестве анализируемого материала я выбрал базу данных Drake Lyrics с сайта Kaggle.
В датасете содержатся тексты песен с сайта Genius.
В ходе анализа датасета я посчитал наиболее наглядными следующие виды графиков.
Гистограмма Круговая диаграмма Линейный график
1. Часто используемые слова

Здесь можно увидеть что музыка Дрейка довольно коммерческая и представляет некий поп рэп, поэтому в текстах мало ругательств, а много, например слова любовь.
2. Песни с самым большим количеством слов

Тут можно заметить что его песни по количеству слов в целом схожи и имеют относительно одинаковое количество слов в треке. Это может говорить например о том, что его треки заточены под телевизионные и радио форматы, с определенными требованиями.
3. 5 самых длинных слов
Анализ же самых длинных слов может натолкнуть на мысли, что автор так же не забывает и рефлексировать на серьезные темы, а не только пишет песни «для толпы».
4. Количество слов в альбоме
Оценив такой график можно сказать что альбомы с наибольшим количество слов не так популярны, как остальные. Исключение только альбом Scorpions.
https://disk.yandex.ru/d/zMwHJ09NbHAp-g
датасет и блокнот