Original size 1140x1600

Упоминания ключевых фигур французской теории второй половины XX века.

PROTECT STATUS: not protected
The project is taking part in the competition

Выбор темы

Динамика упоминаний ключевых фигур французской теории второй половины XX века в англоязычном книжном корпусе.

В исследовании анализируется, как менялась частота и структура упоминаний следующих авторов:

— Ролан Барт — Жак Лакан — Луи Альтюссер — Мишель Фуко — Жак Деррида — Жиль Делёз

Направления и авторов я выбрала потому, что последнее время они часто мне встречаются, и мне было интересно посмотреть на статистику упоминаний, связанную с ними. В общем личные предпочтения.

В исследовании я формально делю авторов на структуралистов и постструктуралистов, но это используется как аналитическая рамка. Деление носит условный характер и отражает не всю интеллектуальную биографию авторов, а доминирующие теоретические позиции, с которыми они ассоциируются в англоязычном академическом дискурсе (а данные я беру именно такие).

big
Original size 2222x728

Данные

В качестве источника данных использован Google Books Ngram Viewer (English corpus, версия 2019). Из него были программно выгружены временные ряды относительной частоты упоминаний фамилий авторов в англоязычных книгах за период 1945–2019 гг.

Каждое значение представляет собой относительную частоту (долю упоминаний в общем объёме корпуса за конкретный год). Ресурс найден мной до курса и показался интересным, поэтому для своей задачи взяла именно его.

Для анализа были использованы разные типы визуализаций, каждый из которых отвечает на свой исследовательский вопрос:

— линейный график: динамика авторов во времени — столбчатая диаграмма: общий объём дискурса по годам — круговая диаграмма: вклад авторов за весь период — 100% «stacked bar»: структура внимания внутри каждого года — столбчатая диаграмма: актуальный срез последних лет

Этапы работы и обработка данных

1. Подготовка данных

Данные были выгружены из Google Ngram Viewer через JSON-интерфейс. Таблица приведена к «tidy»-формату (одна строка — один автор, один год). Числовые значения приведены к формату float. Для снижения годового шума применено скользящее среднее с окном 5 лет.

2. Используемые статистические методы

Агрегирование (суммирование по авторам и по годам), нормализация (приведение к процентам внутри года), скользящее среднее (rolling mean), сравнение распределений.

Касательно кода: анализ и обработка данных выполнены с использованием библиотеки Pandas. Для построения визуализаций использовалась библиотека matplotlib, являющаяся стандартным графическим backend Pandas и работающая с данными, подготовленными в табличном формате. Я прикрепляю некоторые этапы, но кода много, целиком можно ознакомиться по ссылке внизу.

3. Использование нейросетей

Нейросети использовались для отладки некоторых частей кода (4 график, логика экспортов) и дополнительного консультирования по работе синтаксиса и возможностей языка.

Все аналитические решения (выбор метрик, интерпретация графиков) принимались вручную. Код (за исключением некоторых указанных выше частей и решения общих вопросов) писался самостоятельно.

4. Стилизация графиков

Графики были стилизованы программно: задана собственная цветовая палитра, использован единый фон, отключены лишние рамки. Стилизация выполнялась исключительно через код.

Холодные оттенки — данные по структуралистам, тёплые — по постструктуралистам. Деление, ещё раз, условное. Палитра выбрана в нейтральных пастельных тонах.

Original size 2222x728

1. Упоминания авторов по годам

Original size 1428x707

График 1

Original size 2051x451

2. Объём упоминаний выбранного набора авторов в каждом году

Original size 1427x707

График 2

Original size 2092x705

3. Доля упоминаний по авторам за весь период

Original size 1037x1067

График 3

Original size 2086x740

4. Распределение внимания между авторами внутри каждого года

Original size 1426x1187

График 4

Original size 2112x762

Актуальный график внимания к авторам в текстах (среднее за последние 5 лет)

Original size 1428x707

График 5

Original size 1992x482

Заключение

Анализ показал, что интерес к французской теории второй половины XX века в англоязычном книжном корпусе меняется со временем и распределяется между авторами неравномерно. Разные типы графиков позволяют увидеть как индивидуальные траектории отдельных фигур, так и общую структуру внимания внутри теоретического поля: периоды роста и спада, смену фокуса и перераспределение значимости между авторами.

Фуко, как оказалось, стабильно последние 30 лет держит планку среди количества упоминаний. Еще показалось занимательным, что в 2010х годах весь корпус упоминаний резко увеличился. Нашла информацию, что это может быть связанно с канонизацией французской теории, её активным использованием в междисциплинарных исследованиях и эффектом массовой оцифровки академических публикаций, что увеличивает видимость цитирований в корпусе Google Books.Фуко, как оказалось, стабильно последние 30 лет держит планку среди количества упоминаний. Еще показалось занимательным, что в 2010х годах весь корпус упоминаний резко увеличился. Нашла информацию, что это может быть связанно с канонизацией французской теории, её активным использованием в междисциплинарных исследованиях и эффектом массовой оцифровки академических публикаций, что увеличивает видимость цитирований в корпусе Google Books.

Original size 2222x728

google doc с кодом: https://drive.google.com/drive/folders/1-kBeTEch48QzSSlstFbqk1svYBK7Dzty

ngrams, откуда брала данные: https://books.google.com/ngrams/

используемая языковая модель: gpt-5.2, https://chat.openai.com/ (части работы сделанные с помощью ИИ указаны выше)