
0 | описание
Для реализации проекта я использовала сайт Kaggle, на котором нашла датасет The Most Popular Books for Exchanging, включающий в себя различные данные (жанр, количество страниц, язык и т. д.) об 1 000 книгах, которые чаще всего принимают участие в обмене между людьми. Этот датасет — отличная возможность узнать, какие книги являются наиболее популярными в обществе.
Итак, цель моего исследования — узнать, какие характеристики включают себя самые распространенные книги для буккроссинга.
Графики, представленные в проекте: 1. столбчатая диаграмма — жанр 2. линейчатая диаграмма — язык 3. точечная диаграмма — кол-во страниц 4. круговая диаграмма — категория возраста 5. точечная диаграмма — год
Графики были выбраны в соответствии с информацией, представленной в датасете, для удобства ее отображения.

Палитра составлена из оттенков: #F0C680, #C0E6F0, #84A7BC, #386570.
Оттенком #F0C680 акцентируется внимание на самых популярных вариантах из датасета.
1 | начало работы

Для начала мною был загружен датасет The Most Popular Books for Exchanging в среду Google Collab. Я импортировала нужные библиотеки и для собственного удобства вывела информацию на экран.
Данные выглядят примерно следующим образом:

2 | самые популярные жанры
Одним из ключевых пунктов при выборе книги или ее обмене является жанр. В качестве первой диаграммы я решила создать столбчатую диаграмму, которая наглядно отображает их популярность.
Ось X — название жанров, ось Y — их популярность среди всех жанров датасета в %.
Неудивительно, что жанр фэнтэзи занимает лидирующую позицию. Во-первых, мир фэнтези обладает очень высокой вовлеченностью читателей. В отличие от произведений в других жанрах, фэнтези предлагает целые проработанные миры со своей историей, географией и законами. Читатели не просто следят за сюжетом — они «живут» в этом мире, картографируют его и обсуждают детали. Такая глубина создает сильную эмоциональную связь, и человеку часто хочется передать эту находку дальше, поделившись целой вселенной, а не просто историей.
Лидерство фэнтези в обмене — это результат сочетания внутренней природы жанра (создающей лояльных фанатов) и внешних социальных практик (превращающих чтение в акт общения), которые идеально совпали с логикой работы платформ для буккроссинга.
3 | язык публикации
Следующим шагом я предлагаю узнать, какой язык является наиболее встречающимся среди книг, добавленных в датасет. Хотя, вероятно, многие смогут сделать верное предположение и без графика.
Неудивительно, что английский язык занимает 96,7% от общего числа языков. В код, написанный для этого графика, я добавила строки с условным оператором if, который отбирал редкие языки и соединял их в одну группу под названием «Другие» для упрощения визуализации.
Тем не менее, давайте все же посмотрим, что из себя представляет топ-5 языков, включающих английский.
4 | количество страниц
Далее мною была сделана точечная диаграмма, отображающая общую популярность количества страниц среди всех книг для обмена.


Таким образом, можно отследить, что среднее количество страниц книг для обмена составляет 379, а самое популярное — 320. Значения недалеки относительно друг друга, и мне кажется, что подобные книги действительно чаще всего читаются быстро и удобно.
5 | возрастная категория
Теперь предлагаю рассмотреть, какая возрастная категория, относящаяся к книгам в датасете, преобладает в графиках. Всего мы имеем три категории: «Adult», «Young Adult», «Children».
Исходя из данных графика, можно сделать вывод, что большинство литературы, которая чаще всего передается из рук в руки, имеет возрастную категорию «Adult». Это может быть по нескольким причинам: например, платформы для обмена книгами, такие как BookMooch или PaperbackSwap, в основном используются взрослой аудиторией. Это активные читатели со сформированными предпочтениями, собственной библиотекой и желанием ее обновлять.
Кроме того, большинство популярных жанров относятся именно к этой категории. Что касается «Young Adult» и «Children» — их доля в круговой диаграмме значительно меньше, и вероятно потому, что молодежь и дети скорее прочитают книгу онлайн, чем купят ее в магазине и позже обменяют на произведение, которое им посоветовал другой человек.
6 | год издания
Из данного датасета мы также можем отследить книги с самым популярным годом издания и их среднее количество выпуска в год.

Выводы по графику:
Давайте предположим, почему именно 2005 год является самым популярным годом издания в данном датасете о книгообмене.
1. Литературный бум середины 2000-х. Середина 2000-х была периодом исключительной продуктивности в издательском мире. В это время завершились или были на пике популярности многие знаковые серии (например, «Гарри Поттер» Дж. К. Роулинг, шестая книга вышла в 2005 г.), активно публиковались авторы, ставшие сегодня классиками жанров фэнтези, мистики и young adult.
2. «Оптимальный возраст» книги для обмена (15-20 лет). У книги, как и у многих товаров, есть жизненный цикл. В первые несколько лет после выхода её чаще покупают новую. Спустя 15-20 лет она уже не новая, но и не антиквариат. Это идеальный возраст для попадания на платформы обмена: книга уже прочитана владельцем, но ещё в хорошем состоянии и представляет интерес для новых читателей.
3. Цикл популярности и переиздания. Успешные книги часто переиздаются к юбилеям или перед выходом экранизаций. К 20-летию (около 2025 года) многие культовые произведения 2005 года могли получить новые издания, что повысило общий интерес и к оригиналам, подогрев спрос на них в сообществах букинистов и любителей обмена.
4. Статистическая концентрация (эффект «среднего»). Средняя линия на графике показывает типичное количество книг, выпущенных за год. Если 2005 год значительно её превышает, это не случайность. Это указывает на реальный всплеск издательской активности или читательского спроса именно в этом году, который затем материализовался в высокой доступности этих книг для обмена.
7 | вывод
Основываясь на проведенном анализе всех аспектов датасета, можно собрать обобщенный портрет самой популярной книги для обмена.
Вероятнее всего, это бестселлер на английском языке, написанный для взрослой аудитории, объемом около 300–400 страниц и выпущенный в 2005 году. Эта статистическая «усредненная» книга — не конкретное произведение, а отражение типичного запроса на платформах книгообмена. Её портрет показывает, что ядро сообщества обмена составляют взрослые читатели, предпочитающие объёмные романы в жанре фэнтези на английском языке, которые были опубликованы в период расцвета этого жанра в середине 2000-х.
Такая книга обладает идеальным балансом для обмена: достаточная литературная ценность и узнаваемость (бестселлер), удобный для чтения объём, актуальность для основной аудитории платформ (взрослые) и доступность на глобальном языке.
Описание применения генеративной модели:
Помощь в генерации кода для графиков: DeepSeek Обложка проекта: Leonardo.Ai