
В поиске подходящих данных я обратил внимание на реестр прокатных удостоверений фильмов на момент 2024 года, опубликованный на портале открытых данных Министерства культуры РФ https://opendata.mkrf.ru/opendata/7705851331-register_movies. Эти данные показались мне интересными для анализа, так как дают возможность изучить особенности киноиндустрии: страны производства, возрастные категории и динамику выпусков.
Диаграммы для вывода данных: столбчатая диаграмма круговая диаграмма гистограмма линейная диаграмма
Я выбрал эти типы, чтобы визуализировать различия и тренды данных максимально понятно и наглядно!

Стилистика графиков: Я выбрал градиент синего и фиолетового для создания единого стиля презентации, вдохновившись обложкой.
Цвета:
Темно-синий: #0b3d91 Светло-синий: #6baed6 Фиолетовый: #9467bd
Обработка данных:
Для анализа данных я использовал Python и библиотеку Pandas. Вот этапы обработки данных:
Загрузка данных: Я загрузил файл реестра прокатных удостоверений, предоставленный Министерством культуры РФ.
import pandas as pd data = pd.read_csv («data-8-structure-4.csv», low_memory=False)
Выбрал столбцы, которые были важны для анализа: «Дата начала показа фильма», «Вид фильма», «Страна производства», «Возрастная категория».
selected_columns = [«Дата начала показа фильма», «Вид Фильма», «Страна производства», «Возрастная категория»] filtered_data = data[selected_columns]
Количество фильмов по годам
Видны пики и спады в производстве фильмов. Например, значительное увеличение количества фильмов в определённые годы может быть связано с культурными или экономическими факторами. Можно заметить, что в 2007 было показано больше всего новых кинолент. Эх, не зря некоторые так хотят вернуть 2007-й
Количество фильмов по типу
Страны создания фильмов
Россия является лидером по количеству фильмов в реестре, что ожидаемо, учитывая фокус на национальную киноиндустрию. Ну и на втором месте конечно же столица мировой киноиндустрии США.
10 Режиссеров по количеству фильмов
Продолжительность фильмов
Большинство фильмов имеет стандартную продолжительность (90–120 минут). Длительные фильмы — редкость, так как среднестатистический зритель не готов на столь длительный киносеанс. Исключением можно считать домашний кинопросмотр.
Распределение фильмов по возрастным категориям
Большинство фильмов ориентировано на широкую аудиторию (0+ и 6+). Фильмы для взрослых (18+) занимают меньшую долю, что соответствует ожиданиям для индустрии кино, так как продажа билетов для семейных фильмов намного прибыльнее.
Датасет, код, промпты https://drive.google.com/drive/folders/1rfROrEYJyEdp3C_YBTxBBAhncLqGktnF?usp=sharing
Использование нейросетей: Для визуальной части проекта я использовал нейросеть DALL-E для генерации обложки презентации и картинок. Так же для помощи с возникающими в коде ошибками я использовал Chat GPT 4o, присылая ему код ошибки.