Описание
Для данного проекта с сайта Kaggle я взяла набор данных о Тейлор Свифт.
Я очень люблю Тейлор Свифт и мы с друзьями часто не можем решить, что закинуть в плейлист для наших посиделок, поэтому мне этот датасет очень откликается и будет круто потом использовать эти данные (особенно такие свежие) для наших посиделок.
Анализ датасета с такими признаками позволяет извлечь ценную информацию о музыкальном контенте и артисте. Например, по признакам danceability, energy и loudness можно оценить общую энергетику песен и их танцевальность, что поможет сформировать плейлисты для различных настроений и событий.
Типы созданных графиков:
- стилизованная столбчатая диаграмма в пастельных оттенках
- интерактивная (библиотека plotly.express) Bar chart со стилизованными колонками (группировка признаков, такой график наиболее релевантен во всех случаях)
Этапы работы: 1.Выбор данных, которые интересно проанализировать, предобработка данных 2.Анализ данных 3.Визуализация
Оформление графиков: В оформлении столбчатых графиков я использовала различные стилизации в пастельные цвета, так как именно с такой атмосферой у меня ассоциируется музыка моего любимого исполнителя!
Описание датасета
Этот набор данных охватывает все альбомы, выпущенные известной американской артисткой Тейлор Свифт, включая данные по 6 июня 2024 года. Самое последнее дополнение к этой коллекции — «The Tortured Poets Department: The Anthology» с 31 треком.
Набор данных был сгенерирован с использованием библиотеки Python SpotiPy и предоставлен в первозданном, нефильтрованном и сыром состоянии, что делает его идеальным для обучения моделей, анализа данных или визуализационных проектов.
Сделаю общую предобработку (импорт библиотек, поверхностный анализ и тд)
Импорт библиотек.
Чистка дубликатов.
Все становится куда лучше. Сейчас я почищу данные.
Например, я выяснила, что ссылки столбец с айди артиста мне вообще неважен, поэтому уберу его, чтобы посмотреть на визуализацию.
Убираю столбец с айди артиста.
Чтобы вновь вдохновиться Тейлор, я проанализирую, насколько она плодотворна, и какой альбом у нее самый емкий.
Анализ данных.
Я стилизовала график, попросив ChatGpt «сделать градиент, где самые емкие альбомы самого темного оттенка розового, самые маленькие — светлые»
Нам, кстати, очень важно, чтобы музыка была «доброй», поэтому важно, чтобы я подобрала для ребят именно такую музыку, поэтому я строю таблицу и анализирую ее.
Убедилась, что музыка по большей части добрая, выявлю теперь топ 5 альбомов с только такой музыкой, на случай, если нас будут слышать соседи, с заботой о них.
Еще для нас важно иногда устраивать не просто ламповые посиделки, но и танцевальный движ, это тоже проанализирую.
Тут попросила ChatGpt покрасить мне график в разные цвета и сделать его интерактивным, он это сделал импортировав библиотеку plotly.graph_objects.
https://disk.yandex.kz/d/fJG7TWKyT5xyrg — блокнот




