
Концепция
Депрессия — одно из самых распространенных психических заболеваний современности, особенно среди студентов, которые сталкиваются с высоким уровнем стресса, академическими нагрузками и социальной неопределенностью. Исследования показывают, что факторы, такие как количество сна, учебная нагрузка, уровень физической активности и социальные взаимодействия, могут оказывать значительное влияние на психическое здоровье.
Так как я сама являюсь студентом, для меня эта тема очень актуальна. Многие из моих друзей переживали и проживают в данный момент этап борьбы с депрессией, поэтому я выбрала анализ именно этой темы.

При создании дизайна для графиков и оформления проекта, я решила использовать серо-синюю цветовую гамму, так как она мне эмоционально проассоциировалась с исследуемой темой.
Картинки я генерировала через нейросеть Leonardo AI. Мне хотелось, чтобы изображения передавали неопределенность, тревогу и потерянность.

При анализе мною был использован датасет Student Depression [1], опубликованный на сайте kaggle.com. В нем содержится разнообразная информация о студентах: пол, возраст, академическая нагрузка, режим сна и прочие факторы, на основе которых можно сделать вывод о комплексном влиянии этих переменных на ментальное состояние студента.

Говоря непосредственно о визуализации данных, я решила выбрать несколько типов графиков. Для показательного соотношения студентов, страдающих депрессией, и ментально здоровых я выбрала круговую диаграмму, для демонстрации разности возрастов — гистограмму. Чтобы изобразить визуальную зависимость часов занятости на работе и учебе студента и наличие заболевания — точечную диаграмму, и столбчатую для того, чтобы пропорционально показать сколько часов спят студенты, стардающие депрессией.
Обработка данных
Первым делом нужно импортировать нужные библиотеки (pandas, numpy и matplotib.pyplot), а зачем проложить верный путь до датасета в формате csv.
Затем, для построения круговой диаграммы, нам потребуется посчитать, у скольких из студентов диагностирована депрессия.
Чтобы в дальнейшем работать с категорией студентов с депрессией, создаем новую переменную (df_depressed). Теперь мы можем нарисовать гистограмму, показывающую соотношение только страдающих депрессией студентов.
Переменная male_data записывает в себя значение возраста, если в столице «Gender» был указан мужской пол. Точно также и с переменной female_data.
По похожему принципу фильтруем переменную sleep_depression_group. Меняем имена столбцов на ['Sleep Duration', 'Count'], чтобы они были более информативными. Теперь мы можем построить вертикальную линейную диаграмму.
Для заключительной точечной диаграммы, сначала я преобразовываю нужный столбец в числовой формат, а затем удаляю все пустые строки и группирую данные.
Визуализация
Круговая диаграмма
Круговая диаграмма показывает, что студентов с депрессией на более чем 15% больше, чем ментально здоровых.
Гистограмма
По графику можно сделать вывод, что в среднем мужчины-студенты чаще страдают от депрессии, чем женщины, но цифры в обоих категориях достаточно высоки.
Точечная диаграмма
Точечная диаграмма показывает закономерный рост количества студентов с диагностированной депрессией по мере увеличения их загруженности учёбой.
Линейная диаграмма
Смотря на этот график, мы видим, что наиболее часто встречающийся режим сна у студента, страдающего от депрессии, включает в себя сон менее 5 часов. Менее половины студентов спят суточную норму 7-8 и более часов.
Источники и промпты
Датасет взят из: Student Depression Dataset. Analyzing Mental Health Trends and Predictors Among Students. –URL: https://www.kaggle.com (дата обращения 20.03.2025).
Использованные нейросети: Leonardo AI URL: https://app.leonardo.ai/image-generation Промпт: Sad atmosphere, a bit abstract. Depression, illness. Colors are dark blue. something is scattered
Блокнот с кодом