
Данные
Я использовала датасет «Top 15,000 Ranked Anime Dataset (Update to 2025)» с Kaggle. Таблица содержит около 15 000 аниме с MyAnimeList с полями: название, жанры, год/сезон премьеры, рейтинг, популярность, количество участников, студии и др. Для генерации изображений я использовала нейросеть Krea, где были задействованы разные промпты по созданию аниме картинок в выбранной стилистике. Я вставила скрин цветовой палитры, найденной в интернете и попросила ее сгенерировать несколько изображений в милой chibi стилистике.

Почему аниме?
На самом деле, основная причина весьма проста: я смотрю аниме, пока делаю учебные проекты, но с каждым разом найти новое, хорошее аниме всё проблематичнее. Перебирать тысячи тайтлов вручную слишком тяжело, вот и получается, что нужен какой-то более быстрый и рациональный подход. Чтобы анализ отвечал требованиям учебного проекта, я не просто буду перебирать статистику в поисках хороших аниме, но и проанализирую, как за последние 30 лет менялись аниме-тренды, а также как связаны рейтинг и популярность.
План анализа и графики
Всего будет 5 графиков: линейный, столбчатая диаграмма, рейтинговая таблица, точечная диаграмма с линией регрессии, ящик с усами. Эти графики покажут, какие жанры были наиболее популярны в тот или иной период (где мне искать, что посмотреть в следующем модуле), какой их средний рейтинг (точно ли мне стоит их смотреть), связана ли популярность с рейтингом, а также как менялись тренды в период с 1990 по 2025 год.
Обработка данных с Pandas
Сначала загрузка исходного CSV с Kaggle через pd. read_csv. Далее идет отбор нужных столбцов: название, жанры, рейтинг (score), популярность (popularity), members, тип, студия, колонка с сезоном/годом премьеры. Остальные отбрасываются.
Линейный график
Этот график показывает динамику развития двух популярных жанров: slice of life и фэнтези. Примерно до 2004 года slice of life в среднем имел меньший рейтинг, чем фэнтези. В 2005–2015 годах ситуация поменялась, и на этом отрезке рейтинг фэнтези проигрывает своему конкуренту. С 2015 года рейтинг обоих жанров то значительно растет, то значительно падает, и в 2023 году в лидеры выбивается slice of life. Так как я ценитель фэнтези, новые аниме я буду смотреть в годы, соответствующие вершинам розового графика.
Сначала код отбирает из датафрейма аниме нужного жанра, группирует их по году (groupby («Year»)) и считает средний score для каждого года, собирая все такие таблицы в trend_df. Затем sns. lineplot строит линейный график, где по оси X — год, по оси Y — средний рейтинг, а параметр hue="Genre» рисует отдельную линию для каждого жанра. Заголовок и подписи осей оформляются кастомным шрифтом и палитрой, чтобы вписаться в общий аниме-стиль.
Столбчатая диаграмма
Эта диаграмма показывает суммарное число жанров, вышедших в этот период, и долю конкретных жанров в общем количестве. Всегда наиболее популярным является «Other». Причина этому проста: эта группа отражает аниме, содержащее в себе несколько жанров. Вторым по популярности идет «comedy», а за ним «action». Наибольшее число фэнтези выходило в двадцатые годы, значит, я обращу свой взгляд на этот период при выборе.
Код считает количество тайтлов по комбинации «десятилетие × жанр» и на основе суммарных значений выделяет топ-жанры, остальное складывая в категорию «Other». Потом данные агрегируются и превращаются в таблицу pivot_table, где строки — десятилетия, столбцы — жанры, а значения — число тайтлов. Эта таблица рисуется как сложенная столбчатая диаграмма с разными цветами для каждого жанра из одного градиента. Заголовок поясняет, что показывается структура жанров во времени, а легенда расшифровывает цвета.
Рейтинговая таблица
Этот график показывает средний рейтинг аниме-жанров в разные годы. Самым высокооцененным жанром стал романтика в 2020–2025 годах, а самым низкооцененным — комедия в 2010–2020 годах. Средний рейтинг аниме за весь период — около 7.
Здесь данные снова группируются, но уже по паре Genre × decade, и для каждой пары считается средний рейтинг (mean ()). Результат записывается в genre_score_decade. После фильтрации только по популярным жанрам создаётся таблица heat, где строки — жанры, столбцы — десятилетия, а ячейки — средний score. Функция sns. heatmap отображает эту матрицу как тепловую карту с подписями внутри ячеек и цветовой шкалой, которая помогает быстро увидеть, в какие десятилетия жанр показывал более высокий или низкий средний рейтинг.
Точечная диаграмма и линия регрессии.
Очень часто случается, что аниме крайне популярно, но при этом совершенно не интересно. Поэтому возникает логичный вопрос: можно ли судить о тайтле по количеству людей в фэндоме? Насколько это разумно? Для ответа на этот вопрос построим точечную диаграмму. Она показывает рейтинг аниме и число активных зрителей. Как видно из графика, корреляция есть, но коэффициент Пирсона около 0,4. Это говорит о том, что связь слабая, большинство точек отдалены от линии тренда. Значит, действительно хорошие тайтлы не всегда нравятся большинству смотрящих, но зачастую всё-таки попадают в поле зрения масс.
Сначала код фильтрует данные: оставляет только аниме с количеством участников больше 1000 и рейтингом в адекватном диапазоне 4–10, чтобы убрать шум. Затем sns. regplot строит точечную диаграмму, где каждая точка — аниме, ось X — его рейтинг, ось Y — число участников (в логарифмической шкале), а поверх точек рисуется линия линейной регрессии, показывающая общую тенденцию. После построения графика считается и выводится коэффициент корреляции Пирсона между score и members, который численно оценивает силу связи «рейтинг — популярность».
Ящик с усами
Эта диаграмма тоже показывает средний рейтинг по жанрам, но дает более точное его распределение. Рейтинг 25% аниме находится ниже, чем нижняя граница ящика. Рейтинг 25% аниме находится выше, чем верхняя граница ящика. Основной разброс рейтинга находится внутри ящика. Усы показывают диапазон значений. Кружочки сверху или снизу — выбивающиеся (слишком высоко или низко оцененные аниме). Один из наиболее хороших показателей у romance, несмотря на несколько рекордно низкорейтинговых аниме. Вторым можно назвать action, а последним по показателям — sci-fi.
Код берёт только строки с жанрами из списка top_genres_box, чтобы сравнивать самые крупные направления. Для каждого жанра подготавливается цвет из той же градиентной палитры, а затем sns. boxplot строит «ящики с усами», где по оси X — жанр, по оси Y — рейтинг; внутри каждого боксплота видно медиану, квартильный размах и выбросы. Такой график показывает, в каких жанрах оценки в среднем выше, где разброс больше и у каких направлений чаще встречаются очень высокие рейтинги.
Выводы
Личные: Теперь я знаю, в какие периоды какие жанры мне стоит искать, а также что имеет смысл ориентироваться не только на популярность, но и на рейтинг.
Аналитические: За 30 лет вкусы зрителей ушли от sci-fi в сторону фэнтези, романтики и повседневности, причём эти жанры стабильно получают высокие средние оценки. При этом жанры-лидеры по рейтингам часто оказываются гибридными (action + fantasy, isekai + slice of life), что видно по росту «смешанных» категорий и разнообразию жанровых комбинаций в новых релизах. Про рейтинг можно сказать, что он помогает аниме стать популярным, но не заменяет эффект моды, маркетинга и общей видимости тайтла.