
Проект описывает процесс обучения модели Stable Diffusion для генерации портретов в стиле художницы Meybis Ruiz Cruz, используя Kaggle и пользовательский датасет. Основная цель — создание нейросети, способной воспроизводить уникальный стиль художницы в сгенерированных изображениях.

Подготовка датасета

Для обучения нейросети был собран датасет из 50 работ художника. Автор специализируется в большей степени на портретах, соответственно, нейросеть чаще выдает погрудный или головной портрет.
В работах художницы прослеживается небольшая вариация стилистики: от сильно мультяшной до живописного реализма. Однако во всех работах содержатся «уверенные» мазки фактурных кистей, «угловатость» и чередование заливочных цветов и градиентов.


Результаты обучения
Первым делом бы протестирован вариант генерации портрета Мэрилин Монро. Результаты показали неточную схожесть с актрисой, однако стиль рисовки считан удачно.
Как и работы автора, сгенерированные изображения немного варьируются пропорциями. Тем не менее каждый рисунок хорошо имитирует живописные мазки, это заметно как на лицах, так и на волосах.
После проб сгенерировать стилизованный портрет актрисы, было решено прописать в промптах рандомные характеристики внешности, такие как: мужчина с короткими темными волосами и серыми глазами, грустное выражение лица
Два сгенерированных изображения выше вариант мне показались максимально удачными в плане попадания в стиль, даже не смотря на немного «поломанную» анатомию.