
— А что, если будет как в фильме — наступлю на бабочку и будущее изменится? — Тогда не наступай на бабочек… Чего они тебе сделали?!
«Doctor Who»

Концепция
В 2023 году британский научно-популярный сериал «Доктор Кто» отпраздновал шестидесятилетие. С тех пор успел выйти новый сезон, и уже в апреле 2025 года сериал возвращается с юбилейным пятнадцатым сезоном. А это значит, что мы сможем снова наблюдать за приключениями пришельца по имени Доктор, путешествующего со своими спутниками сквозь пространство и время в синей полицейской будке, попутно сражаясь с несправедливостью и помогая нуждающимся.
Я слежу за сериалом с 2017 года — что совсем немного для шоу, которое идёт на экранах с 1963 года. Однако за это время «Доктор Кто» успел стать для меня «комфортным» сериалом: тем, что я постоянно пересматриваю, заново открывая для себя давно знакомые сюжеты. Некоторые серии я уже знаю наизусть. Для меня «Доктор Кто» — не просто очередной сериал, а место, куда можно возвращаться снова и снова. Именно поэтому я выбрала тематический датасет: мне хотелось проанализировать ключевые элементы моего любимого сериала.

В своем анализе я использовала датасет «Doctor Who. All scripts». Датасет содержит прописанные сюжеты каждого эпизода сериала с 1963 по 2019, включая информацию о репликах, эпизодах, персонажах и локациях.
Я выбрала несколько типов графиков: столбчатый (наглядно показывает количество реплик у каждого Доктора), круговой (идеален для визуализации объема реплик спутников), линейчатый (визуализирует самые часто используемые слова), линейный (для анализа динамики упоминания далеков по Докторам). Важно для понимания графиков: главного героя играют разные актеры, от чего существует устоявшаяся нумерация версий Доктора от Первого до Тринадцатой; поэтому в графиках часто фигурируют разные «Доктора», называемые по их порядковому номеру.
Цветовое решение проекта для меня было очевидным с самого начала: сочетание оттенков бежевого и синего. Самый узнаваемый образ, буквально символ сериала — космический корабль TARDIS, который выглядит, как синяя полицейская будка. Кроме того, синий у многих людей ассоциируется с космосом, технологиями и будущем — все это является неотъемлемой частью сериала. Бежевый, наоборот, символизирует время, прошлое, старую бумагу — Доктор постоянно бывает и в прошлом, то доказывая Робину Гуду, что он выдумка, то обсуждая «Гарри Поттера» с Шекспиром! Кроме того, этот выбор цветов был вдохновлен интерьером ТАРДИС в 8-10 сезонах.
Основным цветом проекта я выбрала #003B6F, который носит полуофициальное название «Tardis Blue», потому что ТАРДИС большую часть сериала была выкрашена именно в этот оттенок синего (хотя и случались прецеденты…).
Шрифт, который я выбрала для визуализаций анализа, называется Tuffy: он лаконичный, вытянутый, с хорошей читаемостью и легким намеком на шрифты, используемые в старых компьютерах — все-таки «Доктор Кто» является самым продолжительным научно-популярным сериалом в мире.
Обработка данных
Первым шагом стала загрузка библиотеки pandas и импортировала ее как переменную pd (для удобства). Далее считала скачанный ранее датасет, после чего вывела первые пять строк, чтобы понять состав датасета.
Следющим шагом была обработка данных для первого графика. Для этого я посчитала количество реплик каждого Доктора.
После я приступила к подготовке данных для круговой диаграммы с количеством реплик от спутников. Для этого я посчитала количество реплик каждого из выбранных спутников.
Далее необходимо было обработать данные для следующего графика с самыми популярными репликами в сериале. Для этого я провела фильтрацию по столбцу type, посчитала частотность реплик и выбрала топ-10 самых популярных.
В конце я обработала данные для последнего, линейного графика. Для этого я выбрала строки, в которых используется слово «dalek» и сгруппировала их по Докторам (doctorid).
Точнее, не самый главный (это был хитрый кликбейт), а самый разговорчивый; Доктор с наибольшим количеством реплик.
По построенному графику видно, что наиболее количество реплик (и, следовательно, экранного времени) было у Четвертого Доктора, а наименьшее — у Восьмого. Это и понятно: у Четвертого было семь лет и семь сезонов, а у Восьмого — один полнометражный фильм. Кроме того, видно, что Доктора возрожденного сериала (с Девятого по Тринадцатую) в общем получили меньше реплик, чем «олдскульные» (с Первого по Седьмого). Впрочем, и среди них есть яркий лидер — Десятый Доктор с его 31 тысячью реплик. А вот мой любимый Двенадцатый Доктор места в лидерах, к сожалению, не занял.
У Доктора всегда есть спутница или спутник — компаньон-человек, которому Доктор показывает вселенную. Мне стало интересно, какой из пяти лучших компаньонов всего сериала внес наибольший вклад — сказал больше всего реплик?
На графике явно видны победители: Роуз и Клара, две отважные спутницы, поделили целую половину реплик пополам, по 25% каждой. Почетную бронзу получила Марта, а вот на последнем месте оказался мой личный фаворит капитан Джек Харкнесс: не везет что-то моим фаворитам на реплики.
Вот он, топ-10 наиболее популярных реплик за всю историю сериала.
График получился забавный: несмотря на то, что первыми в списке идут базовые «Да», «Что?» и «Нет», четвертое место заняла реплика «Доктор!» (именно с восклицательным знаком!). Это, на самом деле, довольно точно описывает сериал: персонажи постоянно попадают в смертельно опасные ситуации, в которых остается только звать Доктора, чтобы он решил вопрос.
Злейшими врагами Доктора являются далеки — самые опасные роботы-убийцы во вселенной, похожие на злые перечницы. Какой из Докторов был наиболее обеспокоен далеками?
Уничтожить! Далеки наступают! Особенно на Первого, Второго и Десятого Докторов. Чуть полегче пришлось Третьему, Четвертому и Одиннадцатому. Совсем не беспокоиться о далеках можно Восьмому Доктору — он был слишком занят соперничеством со своим другим врагом, Мастером, чтобы обратить внимание на такую мелочь, как смертоносные перечницы.