
Концепция
Настольные игры — это одновременно продукт, сообщество и культурный феномен.
Для визуализации был выбран датасет Board Games с сайта соревнований для специалистов по Data Science Kaggle. В одной таблице сочетаются «метрики качества» (средний рейтинг), «метрики популярности» (число владельцев, число голосов) и семантические метаданные (жанры, механики, время партии, рекомендуемое число игроков). Это даёт возможность исследовать на основе одного датасета множество пунктов: какие механики и жанры доминируют, как связан рейтинг с сложностью и временем игры, какие игры и почему становятся массовыми.
В проекте реализованы 9 графиков для визуализации обширного количества данных:
Гистограмма рейтинга Распределение среднего рейтинга — чтобы увидеть форму распределения оценок (сколько игр в каждом интервале).
Гистограмма сложности Визуализация частотности распространения простых, средних и сложных игр.
Точечная диаграмма с зависимостью Подходит для отслеживания корреляционных связей между переменами, в данном случае между сложностью и рейтингом с положительной линейной зависимостью.
Линейный точечный график Отображает число релизов по годам и тренды выпусков настольных игр во времени.
Горизонтальный бар топа владельцев Визуализирует самые распространённые игры.
Горизонтальный бар топа жанров
Горизонтальный бар топа механик
Облако слов механик Помогает проще для восприятия зрителем показать распространённость и топ механик по популярности.
Горизонтальный бар топа по среднему рейтингу Выявляет топ «лучших» игр.
Стилизация


Визуальный стиль проекта и графиков был вдохновлен настолько долгими встречами с друзьями для игры в настольные игры, что стол с игровым полем озаряется лучами закатного солнца.
Для шрифта был выбран Moderustic, как плавный и аккуратный вариант без засечек.
Подготовка данных
Сначала код запрашивает файл у пользователя (Colab files.upload ()), автоматически выбирает подходящий файл (CSV/XLSX) и читает его с попытками разных кодировок/разделителей. Это защищает от ошибок чтения (utf-8 / cp1251 / latin-1 и т. п.).
Поскольку разные датасеты используют разные заголовки, в коде реализован поиск похожих имён колонок (например, rating, Rating Average, users_rated и т. д.) и привязка к унифицированным именам (Name, Year, Rating, Num_Votes, Owned, Complexity, Playtime, Categories, Mechanics).
Распределение среднего рейтинга игр
Распределение с пиковой массой в среднем диапазоне (часто 6–8), небольшое правостепенное уменьшение (более высокие рейтинги реже). Это говорит, что большинство игр получают умеренные оценки; выдающиеся игры (9+) — редкость.
Распределение средней сложности
Многие игры имеют среднюю или низкую сложность (подходят широкой аудитории), тогда как высокосложные игры (weight > 3.5–4) встречаются реже. Это помогает понять профиль каталога — семейные/легкие игры vs хардкорные хобби-игры.
Зависимость рейтинга от сложности
Обычно связь слабая — сложные игры не обязательно имеют более высокий рейтинг. Иногда наблюдается лёгкая положительная или отрицательная тенденция в зависимости от выборки, но общий вывод — сложность сама по себе не гарантия высокого рейтинга.
Количество выпущенных игр по годам
Виден рост числа релизов за последние десятилетия (рост индустрии настольных игр). Пики соответствуют активным годам, спад — например, по данным конкретных годов. Это полезно для анализа индустрии и планирования публикаций.
Топ-10 игр по количеству владельцев
Позволяет легко идентифицировать «канонические» хиты и проверить: имеют ли они высокий рейтинг или просто большое распространение.
Топ-20 жанров игр
Видно, какие категории доминируют на платформе; это помогает при дизайнерских решениях и при подборе игр по интересам.
Топ-10 механик настольных игр
Облако слов всех игровых механик
График показывает частоту упоминаний механик; самые популярные механики отображаются крупными словами и более «тёплыми» цветами по градиенту.
Видна визуализация механик: какие механики доминируют (например, Dice Rolling, Card Drafting, Tile Placement и т. п.) и какие встречаются редко.
Топ-5 игр по среднему рейтингу
График помогает увидеть, какие игры представляют собой «критическую массу качества» и какие у них характеристики (короткий playtime/высокая сложность/определённые механики), выявляя лучшие игры для сообщества.
Выводы
Проект показал, что даже относительно «простые» табличные данные по настольным играм дают богатое поле для визуализации и выводов: можно одновременно исследовать качество (рейтинг), популярность (число голосов), жанровую/механическую структуру каталога и временные тренды.
Описание применения генеративной модели
Для помощи с кодом использовался deepseek, для генерации обложки leonardo.ai.
Ссылки
Ссылка на папку с кодом, датасетом и промтами.