
СТРУКТУРА ПРОЕКТА
СТРУКТУРА
• ВВОДНАЯ ЧАСТЬ • ЭТАПЫ РАБОТЫ & ИТОГОВЫЕ ГРАФИКИ • ЗАКЛЮЧЕНИЕ
ВВОДНАЯ ЧАСТЬ
Для итогового проекта были найдены данные о зарплатах разработчиков в период от 2020 до 2024 на интернет-ресурсе https://www.kaggle.com/datasets
Выбор темы обусловлен релевантностью темы и курса, а также личным интересом: какие оплаты труда у разработчиков, и как они меняются в последние годы. К тому же, разработчик — это перспективная и актуальная профессия.
Для иллюстрации было решено использовать линейный график, столбчатые диаграммы, график оценки плотности, так как с помощью них можно лучше всего получить наглядное разнообразное представление большого объема данных.
ЭТАПЫ РАБОТЫ & ИТОГОВЫЕ ГРАФИКИ
Все данные обрабатывались постепенно и код будет прикреплен в итоговых графиках. Нейросети не использовались. Для стилизации графиков был выбран голубой цвет.

Код к первому графику:
avg_salary_per_year = df.groupby ('work_year')['salary_in_usd'].mean ()
plt.figure (figsize=(10, 6)) avg_salary_per_year.plot (kind='line', marker='o', color='#00bfff') plt.title ('Средняя зарплата разработчиков по годам') plt.xlabel ('Год') plt.ylabel ('Средняя зарплата (USD)') plt.grid (True) plt.show ()
Код к второму графику:
avg_salary_per_residence = df.groupby ('employee_residence')['salary_in_usd'].mean ()
plt.figure (figsize=(17, 6)) avg_salary_per_residence.plot (kind='bar', color='#00bfff') plt.title ('Средняя зарплата по регионам проживания сотрудников') plt.xlabel ('Регион проживания') plt.ylabel ('Средняя зарплата (USD)') plt.grid (True) plt.show ()
Код к третьему графику:
import seaborn as sns
plt.figure (figsize=(10, 6)) for level in df['experience_level'].unique (): sns.kdeplot (df[df['experience_level'] == level]['salary_in_usd'], label=level)
plt.title ('Распределение зарплат по уровням опыта') plt.xlabel ('Зарплата (USD)') plt.ylabel ('Плотность') plt.legend (title='Уровень опыта') plt.grid (True) plt.show ()
Код к четвертому коду:
avg_salary_per_employment = df.groupby ('employment_type')['salary_in_usd'].mean ()
plt.figure (figsize=(10, 6)) avg_salary_per_employment.plot (kind='bar', color='#00bfff') plt.title ('Зарплаты в зависимости от типа занятости') plt.xlabel ('Тип занятости') plt.ylabel ('Средняя зарплата (USD)') plt.grid (True) plt.show ()
Код к пятому графику:
avg_salary_per_remote_ratio = df.groupby ('remote_ratio')['salary_in_usd'].mean ()
plt.figure (figsize=(10, 6)) avg_salary_per_remote_ratio.plot (kind='bar', color='#00bfff') plt.title ('Зарплаты в зависимости от доли удаленной работы') plt.xlabel ('Доля удаленной работы (%)') plt.ylabel ('Средняя зарплата (USD)') plt.grid (True) plt.show ()
ЗАКЛЮЧЕНИЕ
Выводы на результате анализа графиков:
1. В последние 3 года зарплата разработчиков значительно увеличилась. 2. В среднем в Катаре, Италии и Малайзии самые высокие зарплаты у разработчиков. 3. В среднем тимлиды получают больше всего, за ними идут сеньоры, мидлы и джуны. 4. В среднем, люди на онлайн-занятости получают больше остальных. 5. Больше всего получают разработчики на полной ставке.
Блокнот с кодом и датасет:
https://drive.google.com/drive/folders/1ozb4gk8WNCM7Czmxo5IWEJ6aPz2M1BgA?usp=sharing
Спасибо!