
Описание проекта
В этом проекте я проанализировал полную историю производства мультфильмов студии Disney с 1937 года до наших дней. Я загрузил датасет с Kaggle и построил серию визуализаций в едином фирменном стиле в Google Colab.
Мне хотелось узнать, в какие десятилетия студия снимала больше всего фильмов. Также было важно понять, как менялись реальные сборы фильмов, если учесть инфляцию. Это показывает, какие годы были самыми успешными. Еще я проверил, для какой аудитории Disney чаще всего создает мультфильмы, посмотрев на возрастные рейтинги. И конечно, я выяснил, какие именно фильмы собрали больше всего денег за всю историю студии.
Выбор темы
Я выбрал для анализа фильмы Disney, потому что мне всегда было интересно, как их картины становятся такими успешными. Хотелось на реальных данных посмотреть, в какие годы выходило больше всего фильмов, какие из них собрали больше денег и как менялись их рейтинги со временем. Так из любви к проектам Disney получился настоящий data science проект.
Вид графиков
В проекте я использовал четыре типа графиков, чтобы показать данные с разных сторон. Столбчатая диаграмма наглядно сравнивает количество фильмов по десятилетиям. Линейный график позволяет увидеть тренд: как менялись средние кассовые сборы от года к году. Круговая диаграмма в виде кольца просто показывает долю фильмов с разными возрастными рейтингами. А горизонтальная столбчатая диаграмма эффективно представляет рейтинг топ-10 самых кассовых фильмов, где длинные полосы и подписи делают сравнение интуитивно понятным.
Используемые статистические методы
В работе я использовал простые статистические методы. Сначала посмотрел на основные цифры: средние сборы, разброс значений. Потом сгруппировал фильмы по десятилетиям и жанрам, чтобы узнать, в какие периоды было снято больше картин и какие направления приносили больше денег. Частотный анализ помог понять, какие возрастные рейтинги встречаются чаще всего. А чтобы увидеть, как менялись сборы с течением времени, я построил график, где по годам отложена средняя касса фильмов. Эти методы позволили перевести историю Disney в понятные цифры и графики.
Референсы визуального стиля
Персонажи Walt Disney
За основу визуального стиля я взял цветовую палитру, характерную для классических фильмов Disney. Голубой цвет особенно характерен для «Золушки» с её нежно-голубым платьем. Темно-синий ассоциируется со Стичем, героем одноимённого мультсериала. Также я добавил в палитру розовый, отсылающий к платьям принцесс вроде Авроры из «Спящей красавицы», и насыщенный малиновый для контраста. Желтый цвет отсылает ко многим персонажам: Симба из «Короля Льва», Белла и Чудовище из «Красавицы и чудовища», Плуто из мультфильмов про Микки Мауса. Эта палитра создаёт ощущение знакомой диснеевской сказочности, но применена к строгим графикам и диаграммам. В результате визуализации выглядят не как сухие отчёты, а как часть волшебного мира, который я анализирую.
Палитра, созданная в Coolors
Графики
График № 1 — мультфильмы по десятилетиям
Чтобы проанализировать, как менялась продуктивность студии, я сгруппировал все фильмы по десятилетиям их выхода. Для этого создал новую колонку decade, преобразовав год выпуска. Затем подсчитал количество фильмов в каждом десятилетии с помощью value_counts () и визуализировал результат столбчатой диаграммой. Это позволило чётко увидеть периоды самой активной работы студии.
Столбчатая диаграмма
Код к графику № 1
График № 2 — динамика кассовых сборов
Для анализа финансовых трендов я рассчитал средние кассовые сборы для каждого года. С помощью groupby ('year') я сгруппировал данные, а затем применил mean () к столбцу Box office. Полученные средние значения были отображены на линейном графике с заливкой под линией, что делает видимыми как общую тенденцию, так и отдельные пики успеха.
Линейный график
Код к графику № 2
График № 3 — распределение по рейтингам IMDb
Чтобы оценить качество фильмов, я работал с рейтингами IMDb. Числовые значения были разделены на категории с помощью функции pd.cut (), которая создаёт интервалы. Полученное распределение по категориям я представил в виде кольцевой диаграммы, которая наглядно показывает долю фильмов разного уровня оценок.
Круговая диаграмма
Код к графику № 3
График № 4 — топ-10 самых кассовых мультфильмов
Для выявления абсолютных лидеров по коммерческому успеху я отсортировал весь датасет по убыванию кассовых сборов с помощью nlargest (10, 'Box office'). Чтобы сделать сравнение интуитивно понятным, я выбрал горизонтальную столбчатую диаграмму, где длина каждого столбца соответствует сборам конкретного фильма, а аннотации с точными значениями помогают быстро оценить масштаб.
Горизонтальная столбчатая диаграмма
Код к графику № 4
Выводы
Анализ показал несколько интересных закономерностей. Самыми продуктивными для Disney оказались 2000-е и 2010-е годы, что говорит о постоянном росте производства. При этом пик средних кассовых сборов пришёлся на 1990-е годы — эпоху «Короля Льва», «Красавицы и Чудовища» и «Аладдина», золотой стандарт успеха. Абсолютным рекордсменом по сборам с большим отрывом стал «Король Лев», чьи кассовые показатели с учётом инфляции до сих пор не превзойдены. Это доказывает, что анимационное наследие Disney остаётся её большим богатством.
Применение генеративной модели
Улучшение кода, вопросы по работе функций, помощь в создании промпта для генерации обложки: Chat GPT
Создание обложки: Leonardo.Ai
Промпт: Create a stylish cover for Disney film data analysis presentation using illustrations and text-free presentations.
Color palette (use as primary colors): #9bccea (light blue) #5c9fca (light blue) #1c4d6d (dark blue) #f495bd (pink) #e5316e (crimson) #fcd465 (yellow)
Abstract composition of: 1. A stylized version of Cinelle Castle, a recognizable Disney symbol, but in a minimalist geometric style 2. Data elements around it: vector graphic lines extending from the castle like rays, symbolizing data analysis 3. Geometric shapes (circles, triangles, bars) in an infographic style 4. Some elements can be semi-transparent to create Depth
Style: - Minimalistic, flat design - Modern, digital look - Depth through layering with varying opacities - Smooth gradients between palette colors
Composition: The castle is the center of the composition, with data elements radiating out from it. Background: Smooth gradient from 1c4d6d at the top to 9bccea at the bottom.
Create an image that looks like a professional data science presentation cover, but with a hint of Disney through the castle shape.
Источники
Coolors — The super fast color palettes generator! : [веб-сайт]. — URL: https://coolors.co/ (дата обращения: 16.12.2025).