Original size 2480x3500

Tarantino Log of Deaths and Swears (2023 Updated, New Categories

The project is taking part in the competition

Концепция

Я выбрала табличный датасет «Tarantino Log of Deaths and Swears (2023 Updated, New Categories)» в формате CSV. В нём по фильмам Квентина Тарантино отмечены события двух типов: ругательства (word) и смерти (death), а также время появления события в фильме и категория ругательства.

Фильмы Тарантино часто обсуждают именно из-за «языка» и уровня насилия. Этот датасет позволяет проверить стереотипы количественно: не просто сказать «там много мата и смертей», а сравнить фильмы между собой, измерить плотность событий и увидеть динамику по ходу фильма. Ценность данных в том, что они событийные и дают возможность анализировать не только «сколько», но и «когда».

Визуальный стиль

Выбор цветовой палитры был основан на фильмах Квентина Тарантина

Original size 2480x1110

Анализ данных

Original size 1377x817

Original size 1377x677

Визуализация данных

Original size 1376x817

Данные я брала с Kaggle https://www.kaggle.com/datasets/bayesfan/updated-2023-tarantino-deathsswearwords Использовала нейросеть ChatGPT для объяснения и исправления ошибок в коде. https://chatgpt.com/

Блокнот

Polina Tomilova

data visualization