Original size 1140x1600

Проект по анализу данных настольных игр

The project is taking part in the competition

Концепция

Настольные игры — это одновременно продукт, сообщество и культурный феномен.

Для визуализации был выбран датасет Board Games с сайта соревнований для специалистов по Data Science Kaggle. В одной таблице сочетаются «метрики качества» (средний рейтинг), «метрики популярности» (число владельцев, число голосов) и семантические метаданные (жанры, механики, время партии, рекомендуемое число игроков). Это даёт возможность исследовать на основе одного датасета множество пунктов: какие механики и жанры доминируют, как связан рейтинг с сложностью и временем игры, какие игры и почему становятся массовыми.

В проекте реализованы 9 графиков для визуализации обширного количества данных:

Гистограмма рейтинга Распределение среднего рейтинга — чтобы увидеть форму распределения оценок (сколько игр в каждом интервале).

Гистограмма сложности Визуализация частотности распространения простых, средних и сложных игр.

Точечная диаграмма с зависимостью Подходит для отслеживания корреляционных связей между переменами, в данном случае между сложностью и рейтингом с положительной линейной зависимостью.

Линейный точечный график Отображает число релизов по годам и тренды выпусков настольных игр во времени.

Горизонтальный бар топа владельцев Визуализирует самые распространённые игры.

Горизонтальный бар топа жанров

Горизонтальный бар топа механик

Облако слов механик Помогает проще для восприятия зрителем показать распространённость и топ механик по популярности.

Горизонтальный бар топа по среднему рейтингу Выявляет топ «лучших» игр.

Стилизация

big
Original size 1517x200
big
Original size 772x230

Визуальный стиль проекта и графиков был вдохновлен настолько долгими встречами с друзьями для игры в настольные игры, что стол с игровым полем озаряется лучами закатного солнца.

Для шрифта был выбран Moderustic, как плавный и аккуратный вариант без засечек.

Подготовка данных

Сначала код запрашивает файл у пользователя (Colab files.upload ()), автоматически выбирает подходящий файл (CSV/XLSX) и читает его с попытками разных кодировок/разделителей. Это защищает от ошибок чтения (utf-8 / cp1251 / latin-1 и т. п.).

Поскольку разные датасеты используют разные заголовки, в коде реализован поиск похожих имён колонок (например, rating, Rating Average, users_rated и т. д.) и привязка к унифицированным именам (Name, Year, Rating, Num_Votes, Owned, Complexity, Playtime, Categories, Mechanics).

Распределение среднего рейтинга игр

Original size 883x484

Распределение с пиковой массой в среднем диапазоне (часто 6–8), небольшое правостепенное уменьшение (более высокие рейтинги реже). Это говорит, что большинство игр получают умеренные оценки; выдающиеся игры (9+) — редкость.

Original size 2048x826

Распределение средней сложности

Original size 884x484

Многие игры имеют среднюю или низкую сложность (подходят широкой аудитории), тогда как высокосложные игры (weight > 3.5–4) встречаются реже. Это помогает понять профиль каталога — семейные/легкие игры vs хардкорные хобби-игры.

Original size 2048x782

Зависимость рейтинга от сложности

Original size 784x584

Обычно связь слабая — сложные игры не обязательно имеют более высокий рейтинг. Иногда наблюдается лёгкая положительная или отрицательная тенденция в зависимости от выборки, но общий вывод — сложность сама по себе не гарантия высокого рейтинга.

Original size 2048x1334

Количество выпущенных игр по годам

Original size 1084x484

Виден рост числа релизов за последние десятилетия (рост индустрии настольных игр). Пики соответствуют активным годам, спад — например, по данным конкретных годов. Это полезно для анализа индустрии и планирования публикаций.

Original size 2048x1146

Топ-10 игр по количеству владельцев

Original size 885x584

Позволяет легко идентифицировать «канонические» хиты и проверить: имеют ли они высокий рейтинг или просто большое распространение.

Original size 2048x1648

Топ-20 жанров игр

Original size 884x584

Видно, какие категории доминируют на платформе; это помогает при дизайнерских решениях и при подборе игр по интересам.

Original size 2048x918

Топ-10 механик настольных игр

Original size 884x584
Original size 2048x918

Облако слов всех игровых механик

Original size 1449x783

График показывает частоту упоминаний механик; самые популярные механики отображаются крупными словами и более «тёплыми» цветами по градиенту.

Видна визуализация механик: какие механики доминируют (например, Dice Rolling, Card Drafting, Tile Placement и т. п.) и какие встречаются редко.

0

Топ-5 игр по среднему рейтингу

Original size 1084x584

График помогает увидеть, какие игры представляют собой «критическую массу качества» и какие у них характеристики (короткий playtime/высокая сложность/определённые механики), выявляя лучшие игры для сообщества.

Original size 2048x1800

Выводы

Проект показал, что даже относительно «простые» табличные данные по настольным играм дают богатое поле для визуализации и выводов: можно одновременно исследовать качество (рейтинг), популярность (число голосов), жанровую/механическую структуру каталога и временные тренды.

Описание применения генеративной модели

Для помощи с кодом использовался deepseek, для генерации обложки leonardo.ai.

Ссылки

Ссылка на папку с кодом, датасетом и промтами.