Original size 1140x1600

Нетфликс: анализ данных

PROTECT STATUS: not protected

//ОПИСАНИЕ ПРОЕКТА

Netflix — одна из самых популярных международных стриминговых платформ и медиакомпания, которая кардинально меняет индустрию развлечений. Совсем недавно в начале декабря компания объявила о том, что собирается приобрести Warner Bros. Discovery, включая HBO и HBO Max, за $82,7 миллиарда. Благодаря этой сделки Netflix получит доступ к обширным библиотекам контента, включая такие популярные проекты, как «Игра престолов», «Гарри Поттер», DC Universe и множество других. В связи с этими новостями было принято решение проанализировать данные касаемо выпускаемых фильмов и сериалов компанией в развлекательном сегменте.

big
Original size 840x353
big
Original size 3185x1804

//ОБРАБОТКА ДАННЫХ

big
Original size 830x720

Как постоянный пользователей Netflix, мне интересно рассмотревать статистику, чтобы лучше понять особенности современной кинематографической индустрии. Для этого я решила разбить анализ на тематические блоки:

/тип контента /выпускаемые фильмы и сериалы по годам /самые частые жанры /распределение рейтингов

Для визуализации данных использовались: круговая диаграмма, линейный график с точками, облако частотности слов, гистограмма. Эти инструменты позволили наглядно отобразить ключевые выводы моего исследования и сделать его более доступным для восприятия.

Информацию для анализа я брала с сайта kaggle — датасет Netflix Movies and TV Shows в формате CSV.

Original size 672x828

Устанавливает нужные библиотеки (gdown для скачивания с Google Drive, wordcloud для облака слов).

Импортирует pandas для работы с таблицами и matplotlib для графиков.

Задаёт цветовую палитру и стили графиков.

Скачивает CSV-файл Netflix с Google Drive и загружает его в DataFrame df.

ЦВЕТОВАЯ СХЕМА

Original size 2200x1270
Original size 1632x392

Визуальное оформление проекта основано на фирменном стиле компании, в основном на дизайне иконок внутри приложения. Палитра проекта создана с помощью Adobe Color. Все цвета перенесены в графики.

БЛОК 1: тип контента

Original size 769x520
Original size 964x1008

БЛОК 2: выпускаемые фильмы и сериалы по годам

Original size 790x1280
Original size 887x487

БЛОК 3: самые частые жанры

Original size 871x520
Original size 790x427

БЛОК 4: распределение рейтингов

Original size 1280x777
Original size 987x486

ЗАКЛЮЧЕНИЕ

В ходе анализа компании Netflix были изучены структура контента, возрастные рейтинги, жанровое разнообразие и динамика добавления материалов по годам. Полученные визуализации позволяют сделать следующие выводы:

Соотношение фильмов и сериалов. В каталоге Netflix преобладают фильмы, однако доля сериалов также значительна, что указывает на сбалансированную стратегию платформы: сервис ориентирован как на любителей короткого формата, так и на зрителей, предпочитающих длительные многосерийные проекты.

Возрастные рейтинги. Наиболее распространены рейтинги, ориентированные на взрослую аудиторию (TV-MA, R), особенно среди сериалов. Это говорит о фокусе Netflix на более зрелый контент с сложными сюжетами и тематиками, тогда как детский и семейный контент представлен в меньшем объёме.

Жанровое разнообразие. Облако слов показало, что чаще всего встречаются жанры Drama, International, Comedy, Action и Documentary. Это подтверждает, что драматические и международные проекты являются ключевыми для платформы, а также подчёркивает глобальную направленность Netflix.

Динамика добавления контента. Количество добавляемого контента росло на протяжении нескольких лет и достигло пика в определённый год, после чего рост замедлился. Это может свидетельствовать о фазе активного расширения библиотеки, за которой последовал переход к более избирательной стратегии наполнения.

Original size 1400x700