

Для анализа я выбрала данные о фильмах студии Pixar, так как это одна из самых успешных анимационных студий в мире. Данные были взяты из открытых источников и содержат информацию о бюджетах, кассовых сборах, актуальности показов и других характеристиках фильмов.
Мне было интересно изучить эти данные, потому что Pixar — не просто студия, а культурное явление, чьи фильмы собирают миллионы зрителей по всему миру. Анализируя их бюджеты, доходы и рейтинги, можно понять, какие факторы влияют на успех анимационного кино.
Для визуализации данных я использовала диаграммы и графики, которые хорошо показывают информацию:
1. Гистограмма 2. Столбчатая диаграмма 3. Линейный график 4. Точечный график
Цветовая палитра

Для начала, чтобы создать визуализацию графиков мы настраиваем стиль, выбираем цветовую палитру. Я решила остановиться на таких ярких, но в то же время пастельных цветах, потому что они ассоциируются с мультфильмами.
Начало работы

Я установила нужные мне библиотеки: — Pandas для обработки данных — Matplotlib и Seaborn для визуализации
Затем импортировала их в файл google colab, чтобы использовать в дальнейшем анализе.
После чего я загрузила датасет фильмов Pixar с сайта Kaggle и провела предварительную обработку данных.
Этот этап работы посвящён предобработке данных. Сначала мы удалили дубликаты, чтобы избежать искажений в анализе. Затем заполнили пропущенные значения медианными значениями бюджета и кассовых сборов, чтобы сохранить целостность данных.
Визуализация данных
График № 1
Код для визуализации гистограммы
График № 1.
Этот график представляет собой гистограмму распределения бюджета фильмов Pixar. Он показывает, как часто встречаются фильмы с разными бюджетами, позволяя выявить наиболее распространённые диапазоны финансирования. Он помогает определить, существуют ли явные тенденции в расходах на производство анимационных фильмов студии Pixar.
График № 2
код для визуализации столбчатой диаграммы
График № 2
Данный график представляет столбчатую диаграмму количества выпущенных фильмов Pixar по годам. Он показывает, в какие годы студия выпускала больше или меньше анимационных фильмов. Анализ этого графика помогает понять, как менялась активность Pixar с течением времени, были ли периоды интенсивного выпуска фильмов или затишья.
График № 3
код для визуализации линейного графика
График № 3
Здесь мы видим линейную динамику кассовых сборов мультфильмов Pixar по годам. Он показывает, как изменялись мировые доходы студии с момента выхода её первых фильмов. Можно понять тренды в коммерческом успехе Pixar: какие годы были наиболее прибыльными, были ли периоды спадов или стремительного роста.
График № 4
код для визуализации точечного графика
График № 4
Этот точечный график показывает зависимость кассовых сборов мультфильмов Pixar от их бюджета. Он показывает, как затраты на производство соотносятся с коммерческим успехом фильма.
Заключение
В ходе анализа датасета с информацией о фильмах студии Pixar можно сделать вывод:
1 График выпуска фильмов показывает, что Pixar стабильно увеличивала темпы создания анимационных картин, особенно в последние десятилетия.
2 Большинство фильмов студии приносят высокие доходы, однако не всегда больший бюджет означает больший успех в прокате.
3 Анализ показал, что хотя крупные вложения могут способствовать большим сборам, встречаются примеры фильмов с умеренным бюджетом, но высокой кассовой успешностью.
Датасет и код
«Описание применения генеративной модели»
Для некоторой части кода был использован ChatGPT как вспомогательный инструмент: https://chatgpt.com