Original size 564x761

Анализ датасета «Taylor Swift»

PROTECT STATUS: not protected

Описание

Для данного проекта с сайта Kaggle я взяла набор данных о Тейлор Свифт.

Я очень люблю Тейлор Свифт и мы с друзьями часто не можем решить, что закинуть в плейлист для наших посиделок, поэтому мне этот датасет очень откликается и будет круто потом использовать эти данные (особенно такие свежие) для наших посиделок.

Анализ датасета с такими признаками позволяет извлечь ценную информацию о музыкальном контенте и артисте. Например, по признакам danceability, energy и loudness можно оценить общую энергетику песен и их танцевальность, что поможет сформировать плейлисты для различных настроений и событий.

Типы созданных графиков:

  1. стилизованная столбчатая диаграмма в пастельных оттенках
  2. интерактивная (библиотека plotly.express) Bar chart со стилизованными колонками (группировка признаков, такой график наиболее релевантен во всех случаях)

Этапы работы: 1.Выбор данных, которые интересно проанализировать, предобработка данных 2.Анализ данных 3.Визуализация

Оформление графиков: В оформлении столбчатых графиков я использовала различные стилизации в пастельные цвета, так как именно с такой атмосферой у меня ассоциируется музыка моего любимого исполнителя!

Описание датасета

Этот набор данных охватывает все альбомы, выпущенные известной американской артисткой Тейлор Свифт, включая данные по 6 июня 2024 года. Самое последнее дополнение к этой коллекции — «The Tortured Poets Department: The Anthology» с 31 треком.

Набор данных был сгенерирован с использованием библиотеки Python SpotiPy и предоставлен в первозданном, нефильтрованном и сыром состоянии, что делает его идеальным для обучения моделей, анализа данных или визуализационных проектов.

Сделаю общую предобработку (импорт библиотек, поверхностный анализ и тд)

Original size 1280x943

Импорт библиотек.

Original size 670x774

Чистка дубликатов.

Original size 710x668

Все становится куда лучше. Сейчас я почищу данные.

Например, я выяснила, что ссылки столбец с айди артиста мне вообще неважен, поэтому уберу его, чтобы посмотреть на визуализацию.

Original size 1280x191

Убираю столбец с айди артиста.

Original size 1280x943

Чтобы вновь вдохновиться Тейлор, я проанализирую, насколько она плодотворна, и какой альбом у нее самый емкий.

Original size 1280x393

Анализ данных.

Я стилизовала график, попросив ChatGpt «сделать градиент, где самые емкие альбомы самого темного оттенка розового, самые маленькие — светлые»

Original size 1280x566

Нам, кстати, очень важно, чтобы музыка была «доброй», поэтому важно, чтобы я подобрала для ребят именно такую музыку, поэтому я строю таблицу и анализирую ее.

Original size 1280x246
Original size 1280x1073

Убедилась, что музыка по большей части добрая, выявлю теперь топ 5 альбомов с только такой музыкой, на случай, если нас будут слышать соседи, с заботой о них.

Original size 1280x623
Original size 1064x1020

Еще для нас важно иногда устраивать не просто ламповые посиделки, но и танцевальный движ, это тоже проанализирую.

Original size 1280x328

Тут попросила ChatGpt покрасить мне график в разные цвета и сделать его интерактивным, он это сделал импортировав библиотеку plotly.graph_objects.

Original size 1280x838
Анализ датасета «Taylor Swift»
Project created at 25.09.2024