Original size 1140x1600

Анализ данных: фильмы студии Pixar

PROTECT STATUS: not protected
big
Original size 3919x689

Для анализа я выбрала данные о фильмах студии Pixar, так как это одна из самых успешных анимационных студий в мире. Данные были взяты из открытых источников и содержат информацию о бюджетах, кассовых сборах, актуальности показов и других характеристиках фильмов.

Мне было интересно изучить эти данные, потому что Pixar — не просто студия, а культурное явление, чьи фильмы собирают миллионы зрителей по всему миру. Анализируя их бюджеты, доходы и рейтинги, можно понять, какие факторы влияют на успех анимационного кино.

Для визуализации данных я использовала диаграммы и графики, которые хорошо показывают информацию:

1. Гистограмма 2. Столбчатая диаграмма 3. Линейный график 4. Точечный график

Цветовая палитра

big
Original size 1929x831

Для начала, чтобы создать визуализацию графиков мы настраиваем стиль, выбираем цветовую палитру. Я решила остановиться на таких ярких, но в то же время пастельных цветах, потому что они ассоциируются с мультфильмами.

Начало работы

big
Original size 2024x796

Я установила нужные мне библиотеки: — Pandas для обработки данных — Matplotlib и Seaborn для визуализации

Затем импортировала их в файл google colab, чтобы использовать в дальнейшем анализе.

Original size 826x304

После чего я загрузила датасет фильмов Pixar с сайта Kaggle и провела предварительную обработку данных.

Original size 2046x414

Этот этап работы посвящён предобработке данных. Сначала мы удалили дубликаты, чтобы избежать искажений в анализе. Затем заполнили пропущенные значения медианными значениями бюджета и кассовых сборов, чтобы сохранить целостность данных.

Визуализация данных

График № 1

Original size 1458x506

Код для визуализации гистограммы

Original size 1714x974

График № 1.

Этот график представляет собой гистограмму распределения бюджета фильмов Pixar. Он показывает, как часто встречаются фильмы с разными бюджетами, позволяя выявить наиболее распространённые диапазоны финансирования. Он помогает определить, существуют ли явные тенденции в расходах на производство анимационных фильмов студии Pixar.

График № 2

Original size 1540x486

код для визуализации столбчатой диаграммы

Original size 2062x1116

График № 2

Данный график представляет столбчатую диаграмму количества выпущенных фильмов Pixar по годам. Он показывает, в какие годы студия выпускала больше или меньше анимационных фильмов. Анализ этого графика помогает понять, как менялась активность Pixar с течением времени, были ли периоды интенсивного выпуска фильмов или затишья.

График № 3

Original size 1714x366

код для визуализации линейного графика

Original size 2146x1104

График № 3

Здесь мы видим линейную динамику кассовых сборов мультфильмов Pixar по годам. Он показывает, как изменялись мировые доходы студии с момента выхода её первых фильмов. Можно понять тренды в коммерческом успехе Pixar: какие годы были наиболее прибыльными, были ли периоды спадов или стремительного роста.

График № 4

Original size 1840x432

код для визуализации точечного графика

Original size 2206x1430

График № 4

Этот точечный график показывает зависимость кассовых сборов мультфильмов Pixar от их бюджета. Он показывает, как затраты на производство соотносятся с коммерческим успехом фильма.

Заключение

В ходе анализа датасета с информацией о фильмах студии Pixar можно сделать вывод:

1 График выпуска фильмов показывает, что Pixar стабильно увеличивала темпы создания анимационных картин, особенно в последние десятилетия.

2 Большинство фильмов студии приносят высокие доходы, однако не всегда больший бюджет означает больший успех в прокате.

3 Анализ показал, что хотя крупные вложения могут способствовать большим сборам, встречаются примеры фильмов с умеренным бюджетом, но высокой кассовой успешностью.

Датасет и код

«Описание применения генеративной модели»

Для некоторой части кода был использован ChatGPT как вспомогательный инструмент: https://chatgpt.com

Анализ данных: фильмы студии Pixar