Original size 1140x1600

Полезные свойства меню McDonald’s

PROTECT STATUS: not protected
10

McDonald’s — это бренд, который знает каждый. Но задумывались ли вы, что скрывается за вкусом их бургеров, картошки фри и напитков? Меня давно интересовал вопрос: как устроено меню этой сети с точки зрения питательных характеристик? Что больше всего влияет на калорийность блюд? Какие категории самые лёгкие или, наоборот, сытные?

Именно поэтому я решил проанализировать данные о питательных характеристиках блюд McDonald’s. Этот анализ не только помогает лучше понять состав их меню, но и даёт возможность взглянуть на него с точки зрения цифр и фактов. Мне хотелось не просто «покопаться» в данных, но и визуализировать результаты так, чтобы это было понятно и увлекательно.

big
Original size 2624x1105

Для анализа я выбрал данные о питательных характеристиках блюд из меню McDonald’s, которые нашёл на платформе Kaggle. Почему именно они? Меню этой сети — одно из самых узнаваемых в мире, а его состав давно вызывает множество споров. Мне стало интересно: какие категории блюд наиболее калорийные? Какой у них баланс жиров, белков и углеводов?

С помощью Python и библиотек Pandas и Matplotlib я провёл исследование, чтобы не только ответить на эти вопросы, но и красиво визуализировать результаты.

Для наглядности я решил использовать несколько разных видов графиков:

Гистограмма — для оценки, сколько калорий содержат блюда и как они распределяются. Точечная диаграмма — чтобы показать связь между калориями и белками.

Линейный график — для отображения средней калорийности блюд в каждой категории.

Линейный график — чтобы увидеть, как категории отличаются по содержанию жиров.

Для оформления я подобрал фирменные цвета McDonald’s: яркий жёлтый, насыщенный красный и зелёный. Это придало графикам стиль, который легко ассоциируется с этим брендом.

big
Original size 1407x441

Обработка данных

Original size 2624x1105

После загрузки необходимых библиотек и файла я решил изучить его содержимое, чтобы понять, как устроены данные и что можно использовать в исследовании.

Original size 1407x537

Данные включают 24 столбца, среди которых такие важные параметры, как Item (название блюда), Category (категория), Calories (калорийность), Protein (белки), Total Fat (жиры) и другие. Кроме того, в таблице не оказалось пропущенных значений, что очень удобно.

Original size 2624x1105

Я решил удалить строки с некорректными значениями, например, блюда с нулевой калорийностью или слишком высокими значениями калорий, чтобы такие данные не мешали анализу.

Original size 1407x426

Данные стали чище и точнее, что позволило избежать искажений в итоговых выводах.

Чтобы исследовать меню более глубоко, я добавил новый столбец, который показывает, какой процент калорий блюда приходится на жиры.

Original size 1407x426

Почему это важно? Доля калорий из жиров помогает понять, насколько сбалансированы блюда и какие из них стоит отнести к «полезным» или «лёгким».

Original size 2624x1105

Для визуализации я рассчитал средние значения калорийности, жиров и белков по категориям блюд. Это позволило увидеть, как категории отличаются друг от друга по составу.

Original size 1407x426

Таблица со средними значениями калорий для каждой категории (Burgers, Salads, Desserts и др.). Эти данные использовались для создания графиков.

Визуализация данных

Original size 1366x765

На этом графике хорошо видно, что большинство блюд содержат от 200 до 600 калорий. Однако есть и «тяжеловесы» с калорийностью выше 1000. Это десерты и большие порции, которые вряд ли подойдут тем, кто считает каждую калорию.

Original size 1366x765

Точечная диаграмма: Корреляция между калориями и белками

Этот график демонстрирует интересную закономерность: чем больше калорий в блюде, тем больше в нём белков. Например, бургеры с большим количеством мяса не только калорийные, но и богаты белками, что делает их хорошим выбором для тех, кто хочет перекусить сытно.

Original size 1358x766

Линейный график: Средняя калорийность по категориям

Категории сильно отличаются по калорийности. Напитки и десерты — лидеры с точки зрения калорий, что неудивительно: сахар делает своё дело. А вот салаты и закуски, напротив, самые лёгкие по калорийности.

Original size 1159x766

Тут мы видим, что «Sandwiches» и «Beef & Pork» — самые жирные категории, благодаря соусам и мясным ингредиентам. В то же время салаты и напитки практически не содержат жиров.

Описание применения генеративной модели

Для своей работы я использовал GPT-4o mini. С помощью него я смог правильно подготовить датасет, исправить ошибки в коде и подобрать хорошую палитру олицетворяющий стиль Макдональдса.

Ссылка на GPT-4o mini: https://chatgpt.com/

Скачать блокнот с кодом и датасет

Ссылка на блокнот с кодом и датасет: https://drive.google.com/drive/folders/1PGOckHwircwcVqHEj28QG5naGeXVj59k?usp=sharing

Original size 2624x1105
Полезные свойства меню McDonald’s
10