

Я решила выбрать кошачьи породы как предмет исследования, чтобы облегчить задачу подбора правильного питомца с помощью наглядного анализа.
Также мне кажется важным сразу обозначить проблемы, с которыми может столкнуться человек, выбирая конкретную породу, или породистое животное в целом.
Датасет взят с сайта Kaggle — Cat breeds details, содержащий информацию о 62 породах котов
Происхождение породы — я решила изобразить с помощью карты
Длина кота — точечный график от меньшего к большему
Общее здоровье — столбчатый график
Минимальная/максимальная продолжительность жизни — линейный график с несколькими кривыми для их сравнения
Совместимость с семьей — круговая диаграмма для наглядности долей от общего количества
Линька — точечный график с градацией
Во время работы я пользовалась perplexity.ai для оптимизации работы с графиками. У меня получилось загрузить в него базу данных с помощью ссылки на Kaggle, поэтому он помогал мне составлять код на протяжении чата.
Визуализация
Для проекта я собрала цветовую палитру из 3 натуральных цветов окрасок кошек и 1 акцентного веселого голубого цвета.

На стиль с простым белым фоном и кошками меня вдохновила телепередача «Cats 101», где животных снимали на белом фоне.
1. География
Информация о происхождении породы не только интересная для любителей кошек, но и полезна для понимания доступности породы в определенном регионе и о ее предпочтении в климате.
Perplexity помог мне сконструировать две карты: объемную с пузырями и развертку с закрашенными областями. Карта с пузырями нагляднее показывает количество, а карта с закрашенными областями достовернее ограничивает территорию происхождения породы.
2. Длина кота
Размер животного — важный показатель для многих людей, поэтому я собрала данные о размерах пород в точечный график от меньшего к большему. График наглядно показывает амплитуду разности размеров котов.
3. Здоровье и продолжительность жизни
Здоровье — один из важнейших показателей выбора питомца, особенно для породистых животных, часто отличающихся особенностями организма. График позволяет увидеть, что в основном породистые кошки обладают средним здоровьем, а группы с максимально низким и высоким показателями наименьшие по количеству.
Для анализа продолжительности жизни я воспользовалась методом описательной статистики во время написания кода:
• Средние значения (avg_life) • Минимум/максимум (диапазоны жизни) • Подсчет частот (количество пород по категориям)
Итоговый график совмещает в себе три кривые минимальной, средней и максимальной продолжительностей жизни. В начальном датасете была информация только о минимуме и максимуме, было необходимо высчитать средние значения.
4. Комфорт в семье
Во время анализа уровня комфорта породы в семье с детьми я использовала метод классификации и категоризации:
• pd.cut () — деление на 5-балльные категории: — Family friendly: [1-5 баллов] • Группировка (groupby) по одинаковым баллам • value_counts () — распределение по категориям
Итоговая круговая диаграмма наглядно иллюстрирует наиболее вероятное отношение породистого кота к детям в семье.
5. Линька
При выборе мохнатого друга важно не забывать о длине шерсти и интенсивности линьки животного, так как это может сильно преобразить домашний быт: длинношерстное животное не только требует постоянный груминг, но и оставляет в шерсти весь дом.
Точечный график сразу указывает на животных почти без шерсти, со средней длинной шерсти и с длинной шерстью.
Заключение