
Вводная часть
Модификация (мод) — это пользовательское расширение игры, которое изменяет или дополняет её механики, контент и технические возможности.

В этом проекте я анализирую пользовательские модификации к игре Minecraft, размещённые на платформе Modrinth. В качестве источника данных используется открытый датасет с сайта Kaggle, в котором собрана информация о тысячах модов: количество загрузок, подписчиков, категории и типы загрузчиков (Fabric, Forge и др.). Данные представлены в формате CSV и анализировались с помощью библиотеки Pandas. Мне было интересно рассмотреть моды не как отдельные проекты, а как целую систему — с лидерами, нишами, инфраструктурой и явным перекосом внимания в сторону небольшого числа популярных решений.
Такой взгляд позволяет воспринимать экосистему модов как рынок пользовательского контента, где спрос и предложение распределены неравномерно.
В рамках проекта были использованы следующие типы визуализаций:
— горизонтальная столбчатая диаграмма, — кольцевая диаграммы, — scatter plots, — гистограмма распределения.
Этапы
Стилизация

Визуальный стиль проекта намеренно сделан тёмным и сдержанным, чтобы напоминать интерфейсы игровых лаунчеров и платформ для моддинга, включая Modrinth. При этом в графиках используются яркие акцентные цвета.
Шрифтовое решение — Inter.
Подготовка данных
График 1
Первым я выбрал график, показывающий самые популярные моды по количеству загрузок. Горизонтальная столбчатая диаграмма хорошо подходит для сравнения значений, сильно отличающихся по масштабу; логарифмическая шкала помогает избежать визуального перекоса.
Здесь мне интересно посмотреть, какие типы модов оказываются в абсолютных лидерах.
Анализ показывает, что среди лидеров преобладают инфраструктурные решения — API и оптимизационные библиотеки, формирующие основу для других модификаций.
График 2
Далее я захотел посмотреть на общее распределение загрузок по всему датасету. Для этого используется гистограмма, которая позволяет увидеть форму распределения, и равномерно ли распределена популярность модов.
Распределение имеет выраженный длинный хвост: большинство модов остаются нишевыми, а внимание сосредоточено у ограниченного числа проектов.
График 3
В третьем графике я перешёл к анализу загрузчиков, на которых распространяются моды. Для этого используется кольцевая диаграмма, так как она наглядно показывает доли в общем объёме. Здесь я смотрю насколько рынок действительно разделён между несколькими основными платформами.
Визуализация показывает концентрацию рынка вокруг Fabric и Forge, при небольшом преимуществе Fabric.
График 4
Затем я рассматриваю связь между подписчиками и загрузками отдельных модов. Scatter plot позволяет увидеть общую тенденцию и разброс значений, а логарифмические шкалы помогают работать с перекошенными данными. Мне интересно проверить, всегда ли рост подписчиков, который может отражать качество модификации, сопровождается ростом загрузок.
Результаты показывают положительную связь, но без строгой линейной зависимости.
График 5
В качестве финального графика я сравниваю категории модов с точки зрения спроса и количества проектов. Для этого используется scatter plot, так как он позволяет одновременно анализировать две величины — число модов в категории и суммарные загрузки. Такой формат удобен для выявления дисбаланса между тем, сколько модификаций создаётся, и тем, насколько они действительно востребованы пользователями.
Я рассматриваю, в каких категориях количество проектов соответствует уровню интереса аудитории, а где наблюдается перекос в сторону перепроизводства или, наоборот, недооценённого спроса. Визуализация показывает, что инфраструктурные категории (Library, Optimization) выделяются высоким уровнем загрузок при сравнительно небольшом количестве проектов, тогда как часть контентных категорий имеет большое число модов, но заметно меньший суммарный спрос.
Вывод
В ходе работы были проанализированы пользовательские модификации к игре Minecraft с использованием нескольких типов визуализаций. Анализ показал, что наибольший спрос сосредоточен вокруг инфраструктурных и утилитарных модов, таких как API и оптимизационные библиотеки, а рынок загрузчиков в основном сформирован двумя платформами — Fabric и Forge. Сравнение категорий выявило дисбаланс между количеством создаваемых модов и реальным интересом аудитории: инфраструктурные категории характеризуются высоким спросом при небольшом числе проектов, тогда как часть контентных категорий демонстрирует признаки перепроизводства.
Дополнительный анализ показал, что между количеством подписчиков и загрузками существует положительная связь, однако она не является строго линейной, что указывает на различия между популярностью и реальным использованием модов. В целом распределение загрузок имеет выраженный длинный хвост: внимание пользователей сосредоточено на ограниченном числе проектов, а большинство модификаций остаются нишевыми. Для меня это исследование было важно тем, что оно помогло понять, какие типы модов действительно востребованы пользователями и как распределяется внимание внутри моддинг-сообщества.
Описание применения генеративной модели
В работе использовалась нейросеть ChatGPT для помощи с операциями Pandas и оформлением визуализаций (шрифт, фон).
Ссылка на модель: https://chatgpt.com/