Original size 1240x1750

Анализ данных о зарплатах разработчиков в период с 2020 до 2024 гг.

PROTECT STATUS: not protected
6

СТРУКТУРА ПРОЕКТА

СТРУКТУРА

• ВВОДНАЯ ЧАСТЬ • ЭТАПЫ РАБОТЫ & ИТОГОВЫЕ ГРАФИКИ • ЗАКЛЮЧЕНИЕ

ВВОДНАЯ ЧАСТЬ

Для итогового проекта были найдены данные о зарплатах разработчиков в период от 2020 до 2024 на интернет-ресурсе https://www.kaggle.com/datasets

Выбор темы обусловлен релевантностью темы и курса, а также личным интересом: какие оплаты труда у разработчиков, и как они меняются в последние годы. К тому же, разработчик — это перспективная и актуальная профессия.

Для иллюстрации было решено использовать линейный график, столбчатые диаграммы, график оценки плотности, так как с помощью них можно лучше всего получить наглядное разнообразное представление большого объема данных.

ЭТАПЫ РАБОТЫ & ИТОГОВЫЕ ГРАФИКИ

Все данные обрабатывались постепенно и код будет прикреплен в итоговых графиках. Нейросети не использовались. Для стилизации графиков был выбран голубой цвет.

big
Original size 877x547

1 график: среднее зарплата разработчиков по годам.

Код к первому графику:

avg_salary_per_year = df.groupby ('work_year')['salary_in_usd'].mean ()

plt.figure (figsize=(10, 6)) avg_salary_per_year.plot (kind='line', marker='o', color='#00bfff') plt.title ('Средняя зарплата разработчиков по годам') plt.xlabel ('Год') plt.ylabel ('Средняя зарплата (USD)') plt.grid (True) plt.show ()

Original size 1280x502

2 график: средняя зарплата по регионам проживания сотрудников.

Код к второму графику:

avg_salary_per_residence = df.groupby ('employee_residence')['salary_in_usd'].mean ()

plt.figure (figsize=(17, 6)) avg_salary_per_residence.plot (kind='bar', color='#00bfff') plt.title ('Средняя зарплата по регионам проживания сотрудников') plt.xlabel ('Регион проживания') plt.ylabel ('Средняя зарплата (USD)') plt.grid (True) plt.show ()

Original size 846x547

3 график: распределение зарплат по уровням опыта. Пояснение: SE — senior, MI — middle, EN — entry level (junior), EX — teamlead

Код к третьему графику:

import seaborn as sns

plt.figure (figsize=(10, 6)) for level in df['experience_level'].unique (): sns.kdeplot (df[df['experience_level'] == level]['salary_in_usd'], label=level)

plt.title ('Распределение зарплат по уровням опыта') plt.xlabel ('Зарплата (USD)') plt.ylabel ('Плотность') plt.legend (title='Уровень опыта') plt.grid (True) plt.show ()

Original size 876x551

4 график: зарплаты в зависимости от типа занятости. Пояснение: PT — part time, FT — full time и т. д.

Код к четвертому коду:

avg_salary_per_employment = df.groupby ('employment_type')['salary_in_usd'].mean ()

plt.figure (figsize=(10, 6)) avg_salary_per_employment.plot (kind='bar', color='#00bfff') plt.title ('Зарплаты в зависимости от типа занятости') plt.xlabel ('Тип занятости') plt.ylabel ('Средняя зарплата (USD)') plt.grid (True) plt.show ()

Original size 877x560

5 график: зарплаты в зависимости от доли удаленной работы.

Код к пятому графику:

avg_salary_per_remote_ratio = df.groupby ('remote_ratio')['salary_in_usd'].mean ()

plt.figure (figsize=(10, 6)) avg_salary_per_remote_ratio.plot (kind='bar', color='#00bfff') plt.title ('Зарплаты в зависимости от доли удаленной работы') plt.xlabel ('Доля удаленной работы (%)') plt.ylabel ('Средняя зарплата (USD)') plt.grid (True) plt.show ()

ЗАКЛЮЧЕНИЕ

Выводы на результате анализа графиков:

1. В последние 3 года зарплата разработчиков значительно увеличилась. 2. В среднем в Катаре, Италии и Малайзии самые высокие зарплаты у разработчиков. 3. В среднем тимлиды получают больше всего, за ними идут сеньоры, мидлы и джуны. 4. В среднем, люди на онлайн-занятости получают больше остальных. 5. Больше всего получают разработчики на полной ставке.

Блокнот с кодом и датасет:

https://drive.google.com/drive/folders/1ozb4gk8WNCM7Czmxo5IWEJ6aPz2M1BgA?usp=sharing

Спасибо!

Анализ данных о зарплатах разработчиков в период с 2020 до 2024 гг.
6