Original size 1140x1600

Анализ данных о взаимоотношениях на работе

PROTECT STATUS: not protected

1. Описание проекта

Введение

Рабочие взаимоотношения и общение с коллективом — ключевой аспект в продуктивном выстраивании общих трудовых процессов и получении эффективного результата.

Выпускники и студенты — как наиболее уязвимая категория людей, начинающих выстраивать карьеру — часто сталкивается со множеством неприятных факторов на первом рабочем месте: дискриминация по половому, возрастному и расовому признакам, домогательства, ущемление, намеренное занижение оплаты труда и обман.

Данные опасения чаще всего небезосновательны: личный опыт первого трудоустройства, громкие новости и заявления, обвинения разного рода в различных медиа, частные расследования дают понять, что данная проблема шире, чем кажется.

В связи с этим я решила провести подробный анализ того, как выстроены взаимоотношения коллег друг с другом и с руководством в других странах.

В основе исследования я взяла три датасета из Евростата, в которых отражены сравнительные показатели по возрасту, полу и региону.

Одна из доступных баз данных представляет статистику на предмет психологического и сексуализированного насилия по отношению к работникам. Я решила включить эти сведения для более глубокого анализа поставленного вопроса.

Таким образом, посредством трех датасетов я смогу выявить масштаб проблематики и понять, среди каких групп населения и регионов данная тема проявляется наиболее остро и по какой причине.

К сожалению, доступные данные отражают сравнительно давний период — с 2006 по 2015 года. Мировая практика такова, что исследования, связанные с дискриминацией и разным опытом насилия, актуализируются нечасто.

Тем не менее, даже на этом этапе длиною почти в 10 лет можно проследить некоторые закономерности, которые, как правило, редко претерпевают значительные изменения спустя время.

2. Предварительный этап: оформление данных

Оформление графиков и поиск стиля

Для визуальной эстетики я сгенерировала несколько изображений в Recraft на офисную тему в яркой палитре, которая подчеркивает эмоциональнй характер любых взаимоотношений.

Данные цвета стали основой в колористическом оформлении графиков и фотографий, благодаря чему представленный анализ данных выглядит стилистически единым.

В качестве основного шрифта для графиков и фрагментов кода я использовала строгий, но стильный JetBrains Mono.

Original size 1000x330

Промт для обложки в Chat GPT для Recraft:

A stylish modern office interior with three women of European appearance talking on the phone and smiling. Bright, vibrant color tones dominate the scene with a strong red accent in the environment or accessories. Soft natural lighting, clean contemporary design, dynamic yet friendly atmosphere, detailed textures, and a professional look.

На основе полученного изображения через Adobe Color я сделала основную палитру для дальнейших генераций и визуализации графиков.

Промты для изображений в Chat GPT:

Слева: Close-up shot of a hand picking up a telephone receiver, with the soft silhouette of a woman in the background. Maintain the exact same muted, industrial-style color palette as in the reference image — warm, subdued tones, soft contrast, atmospheric lighting, realistic textures, and shallow depth of field.

Справа: A highly detailed modern office interior with exposed industrial pipes along the ceiling, scattered documents and papers on desks, multiple computer workstations with glowing screens, office supplies, cables, shelves with folders, soft ambient lighting, realistic textures, high-resolution, professional environment, slight clutter for realism.

В ходе анализа данных наиболее подходящими видами графиков для результатов я нашла следующие 4 вида:

Гистограммы Круговые диаграммы Линейные графики Столбчатые диаграммы

Также для удобства и дальнейшего описания работы в проекте я оставила короткие комментарии с пояснением действий возле каждой строки кода.

Данные ремарки помогают мне и читателю легко соотнести текстовую часть с нужной строкой кода, а также проследить логику действий.

3. Обработка данных

3. 1 Импорт библиотек. Общие настройки

Original size 1024x1280

Промт для Chat GPT: Office core aesthetic illustration of a modern office interior. Several young women standing together, holding papers and documents, casually talking to each other. Calm, professional atmosphere, natural interaction, teamwork and communication. Clean workspace, minimalist furniture, soft lighting.

Первым этапом я импортировала необходимые библиотеки (numpy, matplotlib.pyplot, pandas) и задала им пути к данным из датасетов, где каждый индификатор отвечает за конкретный файл:

7А1 — Хорошие отношения с коллегами 7А2 — Хорошие отношения с начальством 7А3 — Подверженность одному из видов насилия

Также обозначила цветовую палитру для дальнейшей визуализации. Для удобства чтения графиков каждый цвет соотвествует полу или специальным обозначениям, которые нужно выделить.

Original size 1488x812

3.2 Загрузка данных и сортировка

Далее я применила функцию для загрузки данных из файлов и преобразовала их в tidy-формат. Таким образом, метаданные исходного датасета с нужными параметрами высвечиваются в одной строке.

После — переименовала первую колонку для удобства чтения данных, разделила ее для возможности группировки по конкретному параметру и наконец — объединила с основной таблицей.

Теперь каждая строка определяет пол, возраст и страну респондента.

Original size 1783x812

3.3 Очистка значений

Original size 1024x1280

Промт для Chat GPT: Office core aesthetic illustration, close-up view. Feminine hands with neatly painted nails typing on a laptop keyboard. Elegant, professional mood, soft and confident gesture. A green indoor plant placed next to the laptop, adding freshness and balance to the composition.

Я заметила, что в датасете встречаются отсутствующие значения в виде пустых ячеек или знаков «:», спецсимволы (или флаги качества) и текст вместо чисел. Чтобы графики отображались с корректной информацией, эти данные необходимо устранить.

Поэтому я применила функцию соотвествующей очистки сlean_value с соотвестствущей заменой значений. Например, теперь флаги качества заменяются только на числа.

Original size 2477x781

Также видим, что в исходном файле годы представлены колонками, а не строками. Сотвественно — необходимо писать новый код для каждой колонки.

Чтобы упростить фильтрацию и агрегацию, преобазовываем первоначальный формат wide в tidy.

Для удобства я также использовала форматы int и indicator, чтобы преобразовать год в целое число и объединить несколько файлов соотвественно.

Original size 2477x579

3.4 Объединение параметров и фильтр данных

Объединяем все три датасета и фильтруем исходные данные по трем ключевым параметрам: пол, год и проценты.

Также в датасетах обнаружен агрегат «ЕС», который уже подразумевает среднее значение по всем странам ЕвроСоюза.

Чтобы избежать серьезных искажений в итоговых графиках, исключаем агрегат и оставляем расчет среднего значения только по отдельным странам.

Original size 2477x890

Линейные графики

Первоначально я поставила задачу идти от более широких данных к более конкретным.

Линейные диаграммы демонстрируют, как выглядит общая картина мира по каждому из трех датасетов.

В итоге я отразила средние значения по всем трем категориям датасетов среди наиболее активного возраста — от 15 до 24 лет.

Original size 2431x1351
Original size 889x489

Так, вполне предсказуемой становится результат относительно подверженности насилия по полу: доля женщин среди жертв значительно выше, чем среди мужчин.

Данный перевесь во многом связан с их большей социальной и профессиональной уязвимостью, а также с повышенными рисками в сферах с высокой социальной нагрузкой.

При этом стоит учитывать, что мужчины значительно реже сообщают о фактах или попытках насилия в их сторону, что может занижать статистические данные.

Original size 889x489

Неожиданными стали результаты, связанные со взаимоотношениями между коллегами.

Я решила изучить этот вопрос помощью других текстовых источников и выяснить причину спада в 2010-х годах и последующего активного роста показателей. И я нашла закономерность.

Экономический кризис в 2008 и 2009 годах привел к росту стресса и усиленной конкуренции между сотрудниками из-за угрозы сокращения или увольнения. Как итог — происходят резкие ухудшения в коммуникации между сотрудниками: снижается уровень доверия друг к другу, взаимовыручки, обсторяются конфликты.

Учитывая, что респондентами выступают молодые специалисты, выстраивающие карьеру, данная реакция на мировую ситуацию вполне обоснована.

С 2010 года по мере стабилизации экономики обстановка в коллективе налаживается: в условиях большей стабильности коллеги уважают друг друга и учатся слаженно работать.

Original size 889x489

Данные графика также подтвердили мои ожидания.

Женщины в профессиональной среде, как правило, демонстрируют более предсказуемое и сдержанное поведение, что способствует стабильным взаимоотношениям с руководством. Особеннов в кризисный период, когда женщины-сотрудники стараются сохранить свое место.

Мужчины же в условиях повышенного давления со стороны руководства (в частности — в кризисное время) чаще сталкиваются с конфликтами

Столбчатые диаграммы

При дальнейшем исследовании я решила затронуть последний исследуемый год — 2015 и сравнить те же категории, но взяв за основу возраст и пол.

Таким образом, я смогу понять, как данная ситуация отражается не только на гендерном, но и на возрастном уровне.

В качестве индикатора изменений я взяла разность между полами (F — M). На графиках она обозначена дельтой.

Original size 2137x1015
Original size 989x490

Наибольший разрыв показателей в подверженности насилию наблюдается в самой молодой и социально-уязвимой возрастной группе — от 15 до 24.

Это указывает на значительное влияние факторов физической силы и психологического давления в отношении одной из сторон. Как отмечалось ранее, молодые женщины и подростки относятся к числу наиболее уязвимых групп людей.

По мере взросления данный разрыв сокращается. С возрастом и накоплением социального опыта усиливаются позиции каждой из сторон: расширяется доступ к ресурсам, укреплется социальный статус и повышается способность защитить себя, свои интересы. Данные условия снижают степень уязвимости даже среди женщин и способствуют более равномерном распределению показателей между группами.

Original size 989x490

В данной категории наблюдается более позитивная статистика: с возрастом вероятность конфликтов сводится практически к нулю.

На ранних этапах профессионального пути значительная разница покаателей, вероятно, связана с конкуренцией за карьерный рост, повышение или иные социальные блага.

Original size 989x490

В данном разделе сохраняется преимущество женской доли во взаимоотношениях с руководством.

Согласно вышеописанному предположению, данная корреляция обоснована более «социально ожидаемым» женщин по сравнению с мужчинами.

Original size 1024x1280

Промт для Chat GPT: Office core aesthetic illustration, close-up view. A man’s hand in a classic business suit gently holding a woman’s hand while passing her a pen. Subtle professional interaction, calm and respectful gesture, collaboration and trust in a corporate environment. Focus on hands and details, soft natural movement, elegant composition.

Круговые диаграммы

Original size 2137x1495
Original size 626x690

Заключение

В ходе проведенного анализа боьшинство моих предположений и личных ожиданий оправдались: несмотря на социальные изменения, пооисходившие за последние 10 — 15 лет, распределение показателей по различным категориям остается пактически неизменным, что определяет выявленные результаты как устойчиво закономерные или социально принятые.

Женщины в целом показывают себя как более спокойные и, вероятно, терпеливые, что отражается на их высоких показателях во взаимоотношениях с начальством. Наравне с этим на женскую част приходится и значительный перевес по приверженности насилию.

Мужчины, в свою очередь, чаще вступают в конфликты с руководством и острее реагируют на кризисные моменты, однако в условиях стабильной среды чувствуют себя уверенно и безопасно.

Общим фактором для всех категорий стал возраст: наиболее молодые респонденты в силу недостатка ресурсов и опыта становятся самой уязвимой группой людей среди всех участников исследования.

Описание применения генеративной модели

Chat GPT: 1. Оформление промтов для генерации стилистических изображений 2. Оформление инструкций по внедрению конкретных функций и улучшению кода 3. Проверка фактических данных из промежуточных результатов визуального анализа

Recraft: 1. Генерация стилистически единых изображений

Adobe Color: 1. Составление цветовой палитры на основе генеративного фото.