
Концепция
На первых этапах работы, когда у меня нет четкой идеи что я хочу нарисовать, чаще всего иду от абстрактных форм они могут быть линейными, пятновыми или совмещать и то, и другое. Также предпочитаю работать под музыку, но она чаще всего не влияет на то, что нарисовано. Мне захотелось чтобы в моем проекте музыка Twisted Sister осталась на листе, заложила основу для итоговой картинки, которая может стать обложкой альбома.
Исследование
Мне стал интересен не только мой ассоциативный ряд, но и то, как нейросети видят музыку. ИИ не способен «слушать» композиции, а значит и создавать на их основе образы. В ходе работы над проектом были выведены промты, которые использовались для генерации изображений. Интересно отметить, как генерируется «ассоциативный» промт, из чего исходит ИИ, ведь он не воспринимает музыку в человеческом смысле.

Первое, за что цеплялся ИИ — это слова. Выделялась основная тема трека, например, в «We’re Not Gonna Take It» это отрицание авторитета при генерации оно приняло форму хаотичной геометрии и разрушения.
Второй этап нейросеть уделила внимание характеру музыки. Программа исходит из того, какой у композиции темп, аранжировка, вокальная подача и т. п. Треки с высоким темпом и более агрессивной формой подачи, такие как «Burn in Hell» и «S. M. F.», получили на изображениях резкие формы и яркий контраст.


Напротив, композиция «Don’t Let Me Down» выглядит более спокойно плавные линии, перетекающие цвета.
Третий этап — работа с цветом и текстурой. При выборе цвета ИИ опирается на культурный код группы и часто ассоциируемые с ним мотивы.
Выдержка из диалога с нейросетью: цветовая палитра (чёрный как основа; неоново-красный и электрически-синий как акценты) отсылает к эстетике рок-культуры 1980-х и одновременно функционирует как эмоциональный код; формы (острые геометрические элементы vs. органические потоки) отражают конфликт между контролем и хаосом, присущий творчеству Twisted Sister; текстуры (металл, треснувшее стекло, цифровой шум) создают тактильное ощущение «звучания».
Исходя из получившихся изображений, можно сделать вывод, что некоторые названия цветов ИИ воспринимают буквально и это влияет на результат. Например, генерация композиции «S. M. F. » содержит зеленые линии, похожие на стекающие химикаты в промте фигурировал оттенок синего, называющийся «toxic green», и нейросеть изобразила его в прямом смысле.
Вывод
Нейросети не слышат музыку — они «видят» её через текст: рецензии, метафоры, названия цветов и культурные стереотипы. Визуальные образы строились на трёх уровнях: смысл песни, описание её звучания и рок-эстетика 1980-х. Однако, ИИ часто трактует слова буквально — например, «electric blue» превратился в электросхемы, а не в эмоцию. Полученные изображения — не отражение музыки, а проекция того, как люди о ней говорят.
Таким образом, даже в эпоху ИИ подлинная связь звука и образа возможна только через человеческое восприятие, а нейросеть остаётся лишь эхом нашего языка.
Метод
При рисовании собственных абстракций я придерживалась определенной последовательности действий. Сначала я прослушивала трек с закрытыми глазами, чтобы внимательно вслушаться и разделить музыку на «слои». Во время второго прослушивания я рисовала уже имея примерное представление как можно изобразить ту или иную часть трека. Отдельно стоит отметить, создавая абстракцию, я опиралась на музыкальную комозицию нежели на текст.
Иллюстрации
Носители





