Original size 1140x1600

Продажи Fujifilm Instax. Как продаются моменты?

PROTECT STATUS: not protected
The project is taking part in the competition

Описание проекта

В проекте я использовала нейросети как вспомогательный инструмент: чтобы быстрее разобраться с pandas и matplotlib и улучшить внешний вид графиков. С их помощью я подбирала более читаемые подписи, сетку, легенды и общее оформление графиков. Все расчёты и анализ данных я выполняла самостоятельно в коде, а нейросети использовала только для улучшения визуализации.

Датасет был взят с платформы Kaggle, так как там удобно работать с готовыми табличными данными и их описанием. Я выбрала датасет с продажами Fujifilm Instax, потому что он похож на реальные розничные данные и содержит информацию о датах покупок, товарах, категориях, ценах, скидках, количестве и каналах продаж.

Этапы работы

1.1 Какие данные выбраны и где найдены

Датасет: Fujifilm Instax Sales Transaction Data (Synthetic) Источник: Kaggle (датасет про транзакции продаж Instax, синтетический).

Почему он интересен:

• Это типичный формат данных из ритейла/интернет-магазина: каждая строка — транзакция/покупка товара. • По нему можно решать реальные бизнес-вопросы: • как меняется выручка по времени (тренды/пики); • какие категории и товары дают основной вклад; • как часто применяются скидки и как они «участвуют» в выручке; • как устроена структура продаж по месяцам.

big
Original size 2480x1750
Original size 2480x418

Предобработка и создание новых признаков

Зачем каждая фича нужна:

• Tanggal в datetime — чтобы нормально группировать по времени и строить графики. • gross — сумма «до скидки» (цена × количество). • is_discounted — бинарный признак «есть скидка или нет», нужен для сравнения со скидкой vs без. • discount_rate — относительная скидка в процентах (через np.where, чтобы не делить на 0). • YearMonth — удобный ключ «месяц» для временных рядов: • .dt.to_period («M») берёт месяц, • .dt.to_timestamp () превращает обратно в дату (удобно для Matplotlib).

Original size 2480x1750

После df.info () видно:

• Всего строк: 12 334 • Пропусков нет (Non-Null Count везде 12334) → удобно для анализа. • Типы: • даты: Tanggal (datetime) • числовые: Harga_Satuan, Qty, Diskon_IDR, Total_Penjualan и т. д. • категориальные: Kategori, Nama_Produk, Lokasi_Toko, Metode_Bayar, Hari

Основные колонки (бизнес-смысл)

• Tanggal — дата покупки • Kategori — категория товара (например Kamera / Film / Aksesoris) • Nama_Produk — конкретный товар • Lokasi_Toko — канал продаж/магазин • Metode_Bayar — метод оплаты • Harga_Satuan — цена за единицу • Qty — количество • Diskon_IDR — скидка в IDR • Total_Penjualan — итоговая сумма продажи

Вывод EDA из info: пропусков нет → не нужно чистить NaN и типы данных корректные → можно группировать/агрегировать без проблем.

KPI

• Период: 01.05.2022 — 01.05.2025 • Транзакций: 12 334 • Выручка: 6 420 725 500 IDR • Продано единиц: 23 938 • Средний чек: ~520 571 IDR • Медианный чек: 270 750 IDR • Доля заказов со скидкой: ~0.291 (≈ 29%)

Как это интерпретировать:

• Средний чек сильно выше медианного → распределение чеков асимметричное: есть «дорогие» покупки (например камеры), которые тянут среднее вверх. • Примерно 29% заказов со скидкой → скидки используются заметно, и их влияние стоит анализировать отдельно (что ты и сделал в графике «со скидкой vs без скидки»).

Динамика и структура выручки

0

Структура выручки по категориям

0

ТОП-8 товаров по выручке

0

Выручка по месяцам: со скидкой и без скидки

0

ВЫВОД

В работе были построены несколько графиков, чтобы проанализировать выручку с разных сторон: её динамику, структуру, ключевые товары и влияние скидок. График динамики выручки по месяцам показывает общий тренд продаж, а также периоды роста и спада. Дополнительно выделен месяц с максимальной выручкой, чтобы определить пиковый период.

График структуры выручки по категориям позволяет увидеть, какие категории вносят наибольший вклад в общую выручку и как меняется их доля со временем. График топ-8 товаров по выручке помогает определить товары-лидеры, которые приносят основную часть дохода. График выручки со скидкой и без скидки показывает, какую роль скидки играют в формировании общей выручки и в какие месяцы их влияние становится более заметным.