
Выбор темы
Динамика упоминаний ключевых фигур французской теории второй половины XX века в англоязычном книжном корпусе.
В исследовании анализируется, как менялась частота и структура упоминаний следующих авторов:
— Ролан Барт — Жак Лакан — Луи Альтюссер — Мишель Фуко — Жак Деррида — Жиль Делёз
Направления и авторов я выбрала потому, что последнее время они часто мне встречаются, и мне было интересно посмотреть на статистику упоминаний, связанную с ними. В общем личные предпочтения.
В исследовании я формально делю авторов на структуралистов и постструктуралистов, но это используется как аналитическая рамка. Деление носит условный характер и отражает не всю интеллектуальную биографию авторов, а доминирующие теоретические позиции, с которыми они ассоциируются в англоязычном академическом дискурсе (а данные я беру именно такие).

Данные
В качестве источника данных использован Google Books Ngram Viewer (English corpus, версия 2019). Из него были программно выгружены временные ряды относительной частоты упоминаний фамилий авторов в англоязычных книгах за период 1945–2019 гг.
Каждое значение представляет собой относительную частоту (долю упоминаний в общем объёме корпуса за конкретный год). Ресурс найден мной до курса и показался интересным, поэтому для своей задачи взяла именно его.
Для анализа были использованы разные типы визуализаций, каждый из которых отвечает на свой исследовательский вопрос:
— линейный график: динамика авторов во времени — столбчатая диаграмма: общий объём дискурса по годам — круговая диаграмма: вклад авторов за весь период — 100% «stacked bar»: структура внимания внутри каждого года — столбчатая диаграмма: актуальный срез последних лет
Этапы работы и обработка данных
1. Подготовка данных
Данные были выгружены из Google Ngram Viewer через JSON-интерфейс. Таблица приведена к «tidy»-формату (одна строка — один автор, один год). Числовые значения приведены к формату float. Для снижения годового шума применено скользящее среднее с окном 5 лет.
2. Используемые статистические методы
Агрегирование (суммирование по авторам и по годам), нормализация (приведение к процентам внутри года), скользящее среднее (rolling mean), сравнение распределений.
Касательно кода: анализ и обработка данных выполнены с использованием библиотеки Pandas. Для построения визуализаций использовалась библиотека matplotlib, являющаяся стандартным графическим backend Pandas и работающая с данными, подготовленными в табличном формате. Я прикрепляю некоторые этапы, но кода много, целиком можно ознакомиться по ссылке внизу.
3. Использование нейросетей
Нейросети использовались для отладки некоторых частей кода (4 график, логика экспортов) и дополнительного консультирования по работе синтаксиса и возможностей языка.
Все аналитические решения (выбор метрик, интерпретация графиков) принимались вручную. Код (за исключением некоторых указанных выше частей и решения общих вопросов) писался самостоятельно.
4. Стилизация графиков
Графики были стилизованы программно: задана собственная цветовая палитра, использован единый фон, отключены лишние рамки. Стилизация выполнялась исключительно через код.
Холодные оттенки — данные по структуралистам, тёплые — по постструктуралистам. Деление, ещё раз, условное. Палитра выбрана в нейтральных пастельных тонах.
1. Упоминания авторов по годам
График 1
2. Объём упоминаний выбранного набора авторов в каждом году
График 2
3. Доля упоминаний по авторам за весь период
График 3
4. Распределение внимания между авторами внутри каждого года
График 4
Актуальный график внимания к авторам в текстах (среднее за последние 5 лет)
График 5
Заключение
Анализ показал, что интерес к французской теории второй половины XX века в англоязычном книжном корпусе меняется со временем и распределяется между авторами неравномерно. Разные типы графиков позволяют увидеть как индивидуальные траектории отдельных фигур, так и общую структуру внимания внутри теоретического поля: периоды роста и спада, смену фокуса и перераспределение значимости между авторами.
Фуко, как оказалось, стабильно последние 30 лет держит планку среди количества упоминаний. Еще показалось занимательным, что в 2010х годах весь корпус упоминаний резко увеличился. Нашла информацию, что это может быть связанно с канонизацией французской теории, её активным использованием в междисциплинарных исследованиях и эффектом массовой оцифровки академических публикаций, что увеличивает видимость цитирований в корпусе Google Books.Фуко, как оказалось, стабильно последние 30 лет держит планку среди количества упоминаний. Еще показалось занимательным, что в 2010х годах весь корпус упоминаний резко увеличился. Нашла информацию, что это может быть связанно с канонизацией французской теории, её активным использованием в междисциплинарных исследованиях и эффектом массовой оцифровки академических публикаций, что увеличивает видимость цитирований в корпусе Google Books.
google doc с кодом: https://drive.google.com/drive/folders/1-kBeTEch48QzSSlstFbqk1svYBK7Dzty
ngrams, откуда брала данные: https://books.google.com/ngrams/
используемая языковая модель: gpt-5.2, https://chat.openai.com/ (части работы сделанные с помощью ИИ указаны выше)