Original size 1140x1600

Визуализация параметров кошачьих пород

PROTECT STATUS: not protected
The project is taking part in the competition
big
Original size 1872x630

Я решила выбрать кошачьи породы как предмет исследования, чтобы облегчить задачу подбора правильного питомца с помощью наглядного анализа.

Также мне кажется важным сразу обозначить проблемы, с которыми может столкнуться человек, выбирая конкретную породу, или породистое животное в целом.

Датасет взят с сайта Kaggle — Cat breeds details, содержащий информацию о 62 породах котов

Данные, представленные в источнике:

Происхождение породы — я решила изобразить с помощью карты

Длина кота — точечный график от меньшего к большему

Общее здоровье — столбчатый график

Минимальная/максимальная продолжительность жизни — линейный график с несколькими кривыми для их сравнения

Совместимость с семьей — круговая диаграмма для наглядности долей от общего количества

Линька — точечный график с градацией

Во время работы я пользовалась perplexity.ai для оптимизации работы с графиками. У меня получилось загрузить в него базу данных с помощью ссылки на Kaggle, поэтому он помогал мне составлять код на протяжении чата.

Визуализация

Для проекта я собрала цветовую палитру из 3 натуральных цветов окрасок кошек и 1 акцентного веселого голубого цвета.

big
Original size 1872x738

На стиль с простым белым фоном и кошками меня вдохновила телепередача «Cats 101», где животных снимали на белом фоне.

Original size 1872x630

1. География

Информация о происхождении породы не только интересная для любителей кошек, но и полезна для понимания доступности породы в определенном регионе и о ее предпочтении в климате.

Perplexity помог мне сконструировать две карты: объемную с пузырями и развертку с закрашенными областями. Карта с пузырями нагляднее показывает количество, а карта с закрашенными областями достовернее ограничивает территорию происхождения породы.

Original size 1080x646
0

2. Длина кота

Размер животного — важный показатель для многих людей, поэтому я собрала данные о размерах пород в точечный график от меньшего к большему. График наглядно показывает амплитуду разности размеров котов.

Original size 1080x399
0

3. Здоровье и продолжительность жизни

Здоровье — один из важнейших показателей выбора питомца, особенно для породистых животных, часто отличающихся особенностями организма. График позволяет увидеть, что в основном породистые кошки обладают средним здоровьем, а группы с максимально низким и высоким показателями наименьшие по количеству.

Original size 1080x532
0

Для анализа продолжительности жизни я воспользовалась методом описательной статистики во время написания кода:

• Средние значения (avg_life) • Минимум/максимум (диапазоны жизни) • Подсчет частот (количество пород по категориям)

Итоговый график совмещает в себе три кривые минимальной, средней и максимальной продолжительностей жизни. В начальном датасете была информация только о минимуме и максимуме, было необходимо высчитать средние значения.

Original size 1080x475
0

4. Комфорт в семье

Во время анализа уровня комфорта породы в семье с детьми я использовала метод классификации и категоризации:

• pd.cut () — деление на 5-балльные категории:  — Family friendly: [1-5 баллов] • Группировка (groupby) по одинаковым баллам • value_counts () — распределение по категориям

Итоговая круговая диаграмма наглядно иллюстрирует наиболее вероятное отношение породистого кота к детям в семье.

Original size 1080x551
0

5. Линька

При выборе мохнатого друга важно не забывать о длине шерсти и интенсивности линьки животного, так как это может сильно преобразить домашний быт: длинношерстное животное не только требует постоянный груминг, но и оставляет в шерсти весь дом.

Точечный график сразу указывает на животных почти без шерсти, со средней длинной шерсти и с длинной шерстью.

Original size 1080x228
0

Заключение

Визуализированные графики призваны помочь людям с выбором питомца, а также с принятием решения, категорично ли наличие особенных породистых качеств, или можно рассмотреть опцию приюта.

Original size 1872x630