Original size 2480x3500

Дрю Гуден vs. Таргетированная реклама

PROTECT STATUS: not protected
5

Описание

Дрю Гуден (англ. Drew Gooden) — американский видеоблогер и комик. Он получил широкую известность благодаря своим роликам на платформе Vine, а теперь выпускает видео на своем YouTube-канале на различные темы: от обзоров на рождественские фильмы массового производства до освещения острых конфликтов в Интернете.

В 2021 году Дрю провел следующий эксперимент: в течении недели он покупал все товары, рекламу которых он видел в социальных сетях, вне зависимости от абсурдности самого продукта или цены на него. Результаты экспермента Дрю объединил в видеоролик «I bought every ad I saw on instagram* for a week», который имел ошеломительный успех и, на сегодняшний день, набрал 8,3 млн просмотров.


* принадлежит Meta, запрещенной на территории Российской Федерации организации

Так, один эксперимент стал серией роликов. В некоторых из них он все так же скупает все подряд, а иногда покупает вещи из одной категории, как, например, товары для улучшения ментального здоровья или игрушки для котов. Но суть остается та же — он покупает товары из рекламы, тестирует их и выносит вердикт, который, в основном, неутешительный.

За два года Дрю перепробовал множество товаров, большинство с завышенной ценой, некоторые из них просто странные и бесполезные. Мне стало интересно, как менялся интерес аудитории к этой рубрике, сколько денег было потрачено в каждом видео, и какой в целом был тон у видео. Для этого я решила использовать линейный график, гистограммы и круговые диаграммы.

В проекте было решено использовать палитру, задействованную в баннере YouTube-канала Дрю Гудена. Основные цвета отобраны с помощью сервиса Coolors. В качестве шрифта заголовков и названий видео я выбрала Humor Sans. Шрифт не поддерживает кириллицу, поэтому названия графиков будут на английском. Подписи будут выполнены стандартным шрифтом, чтобы они не перетягивали на себя внимание.

big
Original size 1600x811

Палитра проекта

Подготовка данных

Для анализа необходимо было создать датасет: я решила создать таблицу с названием, датой выхода, количеством просмотров и субтитрами для каждого ролика. Для написания кода для получения названия, даты выхода и количества просмотров видеоролика я обратилась к ChatGPT.

Original size 2032x1582

Промпт: Write a Python script that would get the name, release date and number of views of a YouTube video from the web-page on which the video is located. Use this video as an example: https://youtu.be/Y7i124fZumE

Следующим шагом стал поиск пути извлечения субтитров из видеороликов. По запросу «download youtube subtitles python» мной был обнаружен скрипт с использованием YouTube Transcript API, в котором необходимо указать путь к видео. Используя этот скрипт, а также тот факт, что мне необходимо будет структурировать данные нескольких видеороликов, я доработала код от GPT и привела его к следующему виду:

Original size 2032x1582
Original size 1514x497

Проверка работоспособности кода

В результате субтитры имели вид словарей с ключами «текст», «начало» и «длительность». Два последних для анализа не нужны, поэтому имеет смысл оставить только текст.

Original size 1567x362

Измененный фрагмент кода

Original size 1452x552

Преобразование данных в таблицу

Теперь данные готовы для анализа и можно приступать к следующему этапу.

Визуализация данных

Первый график показывает как менялось количество просмотров в зависимости от даты выхода видео. По графику можно увидеть, что самым популярным является второе видео из рубрики — оно набрало больше 12 миллионов просмотров. В целом, график довольно нестабильный, однако можно точно сказать, что последние три ролика посмотрело меньше всего человек.

Original size 1234x850

Линейный график, показывающий популярность видео

Сначала названия видео были написаны в одну строку и плохо читались, поэтому я попросила ChatGPT это исправить.

Промпт: I wrote a script that draws a line graph showing the number of views of videos and dates the videos were published Right now the titles of videos don’t look good because they’re written in one line they’re very long and overlap with the name of the chart and each other. Can you fix it?

Original size 1731x566

Код для построения графика. Список «colors» был внесен в блокнот чуть раньше, но не попал на скриншот

Далее мне было интересно посмотреть, какие слова чаще всего встречались в выбранных роликах, чтобы попытаться уловить общее настроение в серии. Для визуализации я решила использовать облако слов.

Изначально, в получившемся облаке слов преобладали местоимения и глагол «to be» во всех его проявлениях, а также несколько нецензурных выражений. Для исключения всех этих слов и для включения палитры проекта в изображение я обратилась к ChatGPT.

Original size 1810x902

Облако слов

Original size 1731x566

Изначальный код для облака слов

Промпт: I have written a script that generates wordcloud, it looks like this: Can you make a few adjustments to it? 1. Remove profanity 2. Remove pronouns and verbs «do» and «be» in all their forms 3. Use the palette that I’ve sent you before 4. Exclude all the words that are shorter than four characters

Original size 1411x1358

Дополненный код

В результате можно увидеть, что самые произносимые слова остаются нейтральными. Также встречаются названия товаров и другие слова, относящиеся к теме: «money», «review», «expensive», «cost» и так далее. В целом, таким способом общее настроение уловить не удалось, поэтому я решила прибегнуть к другому варианту.

Круговые диаграммы ниже отражают процент позитивных и негативных слов в каждом видео из серии. Слова из видео сравнивались с словарями позитивных и негативных слов.

Практически во всех видео процент позитивных слов значительно превышает процент негативных и, в основном, держится в районе 65%. Самым позитивным видео является ролик под названием «We Ate the Squares», где Дрю обозревал один продукт — переработанную квадратную еду. Также этот ролик он записывал вместе с женой. Самым негативным роликом оказался самый последний — «The dumbest things I’ve ever bought for this channel», который также является подведением итогов для всех остальных.

Original size 1894x1599

Круговые диаграммы, показывающие общее настроение в видео

Original size 1803x748

Код для круговых диаграмм

Гистограмма ниже иллюстрирует, сколько всего было потрачено на товары в каждом видео. Самым дорогим роликом оказался «Do these mental health products even do anything?», общая цена на товары для ментального здоровья значительно превысила остальные и составила чуть меньше четырех тысяч долларов. Меньше всего было потрачено в видео «Trying the weirdest cat toys on the internet».

Original size 1234x850
Original size 1731x476

Поиск цен в субтитрах и объединение их в датасет

Original size 1731x476

Код для гистограммы

Использованные модели и инструменты

ChatGPT — составление датасета и улучшение кода Coolors — составление палитры

Источники

1. Python — Downloading captions from YouTube // GeeksforGeeks. — URL: https://www.geeksforgeeks.org/python-downloading-captions-from-youtube/ (дата обращения: 18.12.2024). 2. Python Regular Expressions // Google for Education. — URL: https://developers.google.com/edu/python/regular-expressions (дата обращения: 19.12.2024).

Ссылка на Google Colab

Дрю Гуден vs. Таргетированная реклама
5