Original size 1750x2480

Brecht Evens | обучение генеративной нейросети

PROTECT STATUS: not protected
9

Концепция

Эвенс Брехт — современный бельгийский комиксист и иллюстратор, известный такими произведениями как «Пантера», «Полуночники», «Любители».

big
Original size 3000x1000

Эвенс Брехт | «Пантера», 2021, Бумкнига | фрагменты комикса

Меня заинтересовали самобытность и красочность его стилистики, что и стало причиной становления вопроса: \- а сможет ли нейросеть воссоздать столь аутентичный стиль и ухватить общую атмосферу работ художника?

big
Original size 2300x1020

Эвенс Брехт

Эвенс Брехт | кадрированные фрагменты работ

Мной были выделены основные пункты, по которым в дальнейшем я планировала проводить сравнение между подлинными работами Брехта и сгенерированными нейросетью, обученной по его иллюстрациям:

- Красочность - Насыщенность - Четкость линий и форм - Сумбурность и хаос - Детализация

big
Original size 1461x632

Эвенс Брехт | датасет кадрированных работ

Сгенерированные изображения

«photo collage in Brecht style…»

«a communication between a tall giraffe and a little girl» | «night bar with red lighting and lots of people»

Original size 1024x1024

«a bouquet of flowers in a sunny kitchen»

На мой взгляд, самым удачным примером является «a bouquet of flowers in a sunny kitchen» — получилось добиться некоторой акварельности, но при этом избежать лишнего наслоения цветов и объектов друг на друга. При добавлении на это изображение линий, отделяющих силуэты предметов друг от друга, схожесть с работами Брехта может стать крайне высокой.

Original size 3100x1000

«paints a picture in a spacious studio» | «plush toys of an elephant, a bear and a cat sit at a table and drink tea» | «a boy sits on a chair in the living room and reads a book»

Первое, что бросается в глаза: приглушенность цветов. В отличии от авторской стилистики, сгенерированные нейросетью изображения отличаются некоторой блеклостью и приглушенностью. Цвета и оттенки смешиваются, уходя от чистоты и точности Брехта.

Однако с передачей атмосферы хаоса и напряжения нейросеть, по моему мнению, справилась удачно. Большое количество деталей, множество фоновых, едва уловимых образов и действий, бесконтрольность происходящего — все это пленяет взгляд и заставляет рассматривать сюжеты подольше.

«a pack of wolves running on a full moon» | «empty room with a lonely plant»

Нельзя сказать, что обученная мной нейросеть сумела повторить стилистику выбранного художника в точности. Были потеряны такие важные составляющие как:

- четкость линий и форм - насыщенность цветов - наличие контура - общая иллюстративная стилистика

фрагмент иллюстрации Эвенса Брехта | сгенерированнное изображение «landscape of a Soviet city»

Original size 1430x534

датасет сгенерированных изображений

При этом не могу не заметить, как сложно нейросети изображать живых существ на том уровне стилизации, на котором это делает Эвенс Брехт. Его люди условны, их формы немного абстрактны. В то время как на сгенерированных изображениях люди и животные отличаются объемами и реалистичными пропорциями, а вписываются они в общее окружение в большей части только из-за живописных мазков.

В качестве заключения можно сделать вывод, что нейросети пока не способны полностью копировать аутентичность и индивидуальность авторского стиля художника. Объединяя полученную из датасета информацию с базовыми настройками, нейросеть старается собирать все свои знания в единую картинку. Это отвечает запросу «схожей» стилистики, однако пока далеко от создания абсолютной копии.

Процесс обучения

В качестве среды для написания кода использовался Google Colab.

После установки необходимых библиотек импортируется датасет с иллюстрациями Эвенса Брехта, которые предварительно были кадрированы до размера 1024×1024 и все переведены в формат JPG.

Original size 1508x282

Далее следует оптимизация процессов работы с библиотеками, связанных с машинных обучением и Hugging Face, и настройка кодировки.

После чего я приступила к непосредственному обучению модели с помощью подгруженной до этого библиотеки «Accelerate». Здесь как раз и создаю отличительный промпт, который будет использоваться во время генераций: «photo collage in Brecht style».

Original size 1079x749

После проверки результатов обучения модели был создан путь на Hugging Face для сохранения модели и данных.

0

И в качестве последнего этапа происходит последовательная генерация изображений с пробой разных настроек влияния обученной модели на базовую:

- checkpoint-250 - checkpoint-250, lora_scale=0.3 - checkpoint-500 - checkpoint-500, lora_scale=0.9

Описание применения генеративной модели

В качестве базовой модели для обучения использовалась нейросеть Stable Diffusion .

Источники изображений

1. Брехт Эвенс Пантера. — 2-е изд. — СПб.: Бумкнига, 2021. 2. BRECHT EVENS (URL: https://brecht-evens.squarespace.com/) — дата обращения 04.04.2025

Brecht Evens | обучение генеративной нейросети
9