Original size 912x1280

Анализ и визуализация данных с помощью Pandas

PROTECT STATUS: not protected

Вводная часть

Для данного анализа я выбрала данные о рынке труда, представляющие собой средние зарплаты по профессиям и регионам. Эти данные позволяют получить представление о том, какие профессии и в каких регионах наиболее оплачиваемы. Они имеют особую ценность, так как позволяют оценить экономические различия между регионами и выделить наиболее востребованные профессии на рынке труда. Визуализация представлена в виде нескольких типов графиков: столбчатые диаграммы были выбраны для отображения зарплат по профессиям и регионам, так как они наглядно показывают различия в величине заработных плат. Круговая диаграмма была использована для отображения долей зарплат в топ-5 профессий, что помогает быстро оценить их относительное распределение.

Этапы работы

Для обработки данных я использовала библиотеку Pandas. Сначала данные были загружены из CSV-файла, содержащего информацию о средних зарплатах по профессиям и регионам. После этого данные были обработаны с использованием группировки по профессиям и регионам для получения средней зарплаты в каждой категории. Группировка позволила увидеть распределение зарплат по разным регионам и профессиям, что помогло выявить наиболее и наименее оплачиваемые профессии. Затем данные были отсортированы по убыванию для того, чтобы выделить топ профессий и регионов с самыми высокими зарплатами. После этого я приступила к визуализации данных с помощью библиотеки Matplotlib. Для каждой группы были построены столбчатые диаграммы, которые наглядно показывают различия в зарплатах по профессиям и регионам. Дополнительно была создана круговая диаграмма, чтобы отобразить распределение зарплат среди топ-5 профессий.

Для стилизации графиков я использовала встроенные возможности библиотеки Matplotlib, выбрав стиль «ggplot», который хорошо подходит для создания чистых и читаемых визуализаций с использованием мягких цветовых схем и приятной глазу сетки. Моя цель была в том, чтобы графики выглядели минималистично, но при этом оставались информативными. Я также использовала разные цветовые палитры для каждого типа графиков, чтобы сделать их визуально разнообразными, но при этом сохранить согласованность стиля. Вдохновением для стилизации послужили классические инфографики, которые часто встречаются в научных статьях и отчетах, выполненные в простом, но эффективном стиле с четкими шрифтами, сетками и умеренным использованием цвета для выделения ключевых данных.

Итоговые графики

График «Средняя зарплата по профессиям» представляет собой столбчатую диаграмму, где каждая профессия отображается по оси X, а по оси Y указана средняя зарплата в рублях. Используя этот график, можно быстро увидеть различия в уровне оплаты труда по каждой профессии. Например, профессии в сфере IT, такие как программист или разработчик игр, имеют более высокие зарплаты по сравнению с другими профессиями. Благодаря сортировке по убыванию значений зарплат, диаграмма позволяет легко выявить топовые профессии с самой высокой оплатой.

Original size 795x501

График «Средняя зарплата по регионам» также представлен в виде столбчатой диаграммы. На оси X указаны регионы, а на оси Y — средняя зарплата в рублях. Этот график позволяет наглядно сравнить уровень зарплат в разных частях страны. Он показывает, в каких регионах зарплаты выше, а в каких ниже, что может быть полезно для анализа экономической активности или уровня жизни в тех или иных местах. Региональные различия могут быть обусловлены как спросом на конкретные профессии, так и уровнем экономического развития самого региона.

Original size 807x500

График «Топ-10 профессий с самой высокой зарплатой» представлен в виде столбчатой диаграммы, которая демонстрирует профессии с наивысшей средней заработной платой. Этот график позволяет быстро выделить наиболее высокооплачиваемые профессии, такие как программист, архитектор или разработчик игр. Столбцы упорядочены по убыванию, что помогает сразу увидеть, какие профессии находятся на вершине по уровню оплаты труда. Такой график полезен для анализа тенденций на рынке труда и для оценки, какие профессии являются наиболее прибыльными

Original size 825x508

График «Топ-10 регионов с самой высокой зарплатой» также представлен в виде столбчатой диаграммы, которая отображает регионы с наивысшей средней зарплатой. На графике видно, какие регионы лидируют по уровню доходов. Этот анализ помогает выделить экономически развитые регионы, где средний уровень оплаты труда значительно выше, чем в других частях страны. На графике можно заметить, что такие города, как Москва и Санкт-Петербург, традиционно находятся в верхней части списка, что указывает на их высокий уровень экономической активности.

Original size 805x501

График «Распределение зарплат по профессиям» представлен в виде «boxplot» (ящик с усами), который наглядно показывает разброс зарплат по каждой профессии. Этот тип графика отображает медианные значения, а также диапазоны зарплат (межквартальный размах) и возможные выбросы. Он позволяет увидеть, насколько различаются зарплаты внутри каждой профессии, и в каких профессиях наблюдаются значительные колебания. Например, в некоторых профессиях разброс зарплат может быть большим, что указывает на наличие как низкооплачиваемых, так и высокооплачиваемых позиций в пределах одной специальности.

Original size 829x502

График «Распределение средней зарплаты по профессиям (Топ-5)» выполнен в виде круговой диаграммы и демонстрирует, как распределяются средние зарплаты среди пяти самых высокооплачиваемых профессий. Этот график помогает визуально оценить долю каждой профессии в общем объеме топ-5 зарплат. Например, такие профессии, как программист или разработчик игр, занимают значительную часть диаграммы, что указывает на высокий уровень оплаты труда в этих сферах. Круговая диаграмма позволяет легко сравнить вклад каждой из этих профессий в общую картину высоких зарплат

Original size 635x512

Заключение

В заключение, проведенный анализ данных о рынке труда показал значительные различия в уровне зарплат по профессиям и регионам. Наибольшие заработные платы сосредоточены в технических и IT-специальностях, таких как программист и аналитик данных, а также в крупных экономических центрах, таких как Москва и Санкт-Петербург. Визуализация данных помогла наглядно продемонстрировать ключевые тренды на рынке труда и сделать выводы о том, какие профессии и регионы наиболее привлекательны с точки зрения уровня оплаты труда. Блокнот можно просмотреть по QR-коду.

Original size 1280x1280
Анализ и визуализация данных с помощью Pandas
Project created at 25.09.2024