Original size 743x1024

Обучение генеративной нейросети in Filonov Style

PROTECT STATUS: not protected
2
The project is taking part in the competition

Если бы меня спросили, кто мог бы изобрести нейросети до того, как человечество в целом задумалось о потенциале их существования, я бы ответила — Павел Филонов. Он был самым загадочным представителем русского авангардизма и основателем аналитического искусства. Его метод был за гранью доступной человеку области восприятия. Полотна действительно напоминают мне компиляцию нейронных связей, при новом совмещении изображающих ранее не виданный образ.

*Работы Павла Николаевича Филонова получили статус общественного достояния в 2015 году.

Мне показалось интересным обучить нейросеть на его работах. Я ожидала, что при совмещении мышления машины и Филонова должны получиться удивительные изображения, наполненные осмысленностью в ее абстракции.

Я собрала все квадратные картины Павла Филонова, которые нашла, в архив. Его можно посмотреть здесь.

0

Установка необходимых библиотек

Original size 2028x266

Изначально было необходимо установить все нужные библиотеки. Так же, из-за несоответствия версий perf, потребовалось обновление до 17 и перезапуск всего окружения.

Подготовка к обучению

Original size 1138x681
Original size 1318x172

Так как код создавался через Kaggle, с помощью встроенной функции я создала датасет, куда загрузила все фотографии. После добавила их в рабочую папку cher.

Original size 2034x550

После были созданы подписи к каждому изображению. Я удостоверилась, что они считываются правильно.

Original size 2036x914

Далее были сгенерированы префиксы к каждому изображению через определенную функцию caption_images. Так к каждому из них был создан промпт.

Обучение и сохранение модели

Original size 1669x414
Original size 1282x840

На сайте Hugging Face я получила токен, чтобы в последствии обученную модель можно было выгрузить на платформу, и приступила к обучению. Оно заняло около часа.

Сохранив обученную модель на Huging Face, я, наконец, смогла приступить к генерации изображений.

Генерация

В поиске функции для обученной модели, мне показалось интересным использовать ее для создания визуального образа фотосъемок для потенциального бренда одежды или украшений, формирующихся вокруг российской айдентики.

Изначально я написала достаточно короткий промпт и получила довольно абстрактное изображение.

Original size 1024x1024

Kaggle:

photo collage in FILONOV style, fashion photoshoot of a bag against the backdrop of Red Square in Moscow

Поэтому я решила писать более конкретные промпты, и изображения стали намного более детальными.

Original size 1024x1024

Kaggle:

photo collage in FILONOV style, fashion photoshoot featuring a world-famous model wearing a kokoshnik against the backdrop of the Hermitage Museum in St. Petersburg. The photo was taken for a brand presentation in a fashion magazine

Kaggle:

photo collage in FILONOV style, fashion photoshoot of the world-famous model in diamond jewelry against the backdrop of St. Isaac’s Cathedral in St. Petersburg. Focus on her hands. Close-up shot. The photo was taken for a brand presentation in a fashion magazine

Я стала замечать, что с каждой последующей генерацией изображения становились все менее асбстрактными, а люди все больше походили на людей. Архитектура, которую я просила изобразить на фоне, становилась все реалистичнее.

Kaggle:

photo collage in FILONOV style, fashionable photoshoot of a world-famous model in inavant-garde dress against the backdrop of Malevich’s Black Square. The photo was taken for a brand presentation in a fashion magazine / photo collage in FILONOV style, fashionable photoshoot of a world-famous model in inavant-garde male suit against the backdrop of Malevich’s Black Square. The photo was taken for a brand presentation in a fashion magazine

Далее мне стало интересно продолжить генерирование изображений непосредственно на платформе Hugging Face и проследить, как это происходит там. Это ускорило процесс получения результата.

Hugging Face:

photo collage in FILONOV style, fashionable photoshoot of a world-famous model in inavant-garde dress against the backdrop of Malevich’s Black Square. The photo was taken for a brand presentation in a fashion magazine / photo collage in FILONOV style, fashionable photoshoot of a world-famous model in inavant-garde male suit against the backdrop of Malevich’s Black Square. The photo was taken for a brand presentation in a fashion magazine

В изображениях становилось все меньше оригинальной графики художника и все больше типичных для нейросетевых изображений черт. Сохранялся только общий принцип, а образы картин сливались в однотипную структуру.

В итоге нейросеть начала выдавать подобные изображения:

Original size 1024x1024

Hugging Face:

photo collage in FILONOV style, fashionable photoshoot of a world-famous model in undergroung geometric clothes with very fashionable bag and glasses against the backdrop of old Saint-Petersburg street. The photo was taken for a brand presentation in a fashion magazine

Из интереса я добавила к промпту «VERY FILONOV STYLE, EVERYTHING IN FILONOV PAINTONGS» и модель начала коллажировать изображения.

Hugging Face:

photo collage in FILONOV style, VERY FILONOV STYLE, EVERYTHING IN FILONOV PAINTONGS, fashionable photoshoot of a world-famous model in undergroung geometric clothes with very fashionable bag and glasses against the backdrop of old Saint-Petersburg street. The photo was taken for a brand presentation in a fashion magazine

Таким образом, я пришла к выводу, что наиболее стилистически успешные изображения выдаются в начале работы с моделью.

Список использованных в проекте инструментов:

— Stable Diffusion — обучение генеративной нейросети под свой стиль; — Kaggle — выполнение кода и генераций; — Hugging Face — получение токена для обучения нейросети, загрузка полученной модели на сайт, большая часть последующих генераций.

Обучение генеративной нейросети in Filonov Style
2