Original size 847x1077

Паттерны в стиле Кацусики Хокусая

PROTECT STATUS: not protected
5
The project is taking part in the competition

Кацусика Хокусай — японский художник и иллюстратор периода Эдо и автор известной «Большой волны в Канагаве». Это его произведение растаскано на постеры, дизайны канцелярии, одежды, обложек на паспорт и проч. Вы точно ее видели!

big
Original size 2434x1713

«Большая волна в Канагаве», а. Кацусика Хокусай

Однако за всю свою жизнь Хокусай создал более 30 тысяч картин! В них он прибегал к разным приемам, сюжетам, экспериментировал с цветом, элементами и мотивами.

Цель:

Обучить нейросеть создавать изображения в стиле художника Кацусика Хокусай для использования в различных дизайнах вместо уже давно набившей оскомину «Большой волны…».

Примеры работ, а. Кацусика Хокусай

1. Этапы работы и код

1. Я нашла в открытом доступе картинки Кацусика Хокусай, собрала датасет из 35 штук и загрузила его в среду Kaggle. Я старалась выбирать работы разных жанров и техник.

2. Запустила и проверила GPU P 100.

3. С помощью исходного кода создала промпты-описания к картинкам в датасете.

4. Получила токен на Hugging Face и, отредактировав исходный код по туториалу курса, приступила к обучению нейросети Stable Diffusion.

5. Что использовано: инструмент LoRa, максимальный шаг трекинга выставила на 1000, чекпоинт на 500, изображения 512×512.

Спасибо обучающему видео с курса и исходному коду: было интересно и легко работать в Kaggle!

0

Примеры моего кода

2. Результаты обучения

Сначала мне стало интересно, какие промежуточные результаты (то есть на чекпоинте 500) покажет модель.

Original size 1363x1197

prompt = «a photo of KACUKAI style, a cat»

Хаотичность, неадекватность изображения — основные проблемы в изображении живых существ с деталями вроде клюва или хвоста.

Original size 1017x1002

prompt = «a photo of KACUKAI style, a big bird with a fish in its mouth»

ИИ плохо справляется с изображением животных, но лучше с природой — неживыми текстурами и повторяющимися хаотичными элементами.

Original size 1016x1016

prompt = «a photo of KACUKAI style, a big wave»

Известные образы, вроде Мона Лизы, вообще поглощают стиль, на который обучена модель.

Original size 1019x1018

prompt = «a photo of KACUKAI style, Mona Lisa»

Здесь я уже использую финальную модель.

Original size 1003x1018

prompt = «a photo of KACUKAI style, a girl near the sea»

Сравнивая изображения автора и нейросети, я обращаю внимание, с помощью каких деталей ИИ передает эстетику и стиль художника. Композиция с большим количеством «воздуха», маленькие иероглифические подписи в уголках картинок, приглушенные цвета.

Слева авторское изображение Справа генерация

Слева авторское изображение Справа генерация

Слева авторское изображение Справа генерация

Лучше всего нейросеть справляется с пейзажами: тут ей пригождается тяга к детализации и хаосу. С изображением людей и конкретных предметов все обстоит печальнее, хотя если не обращать внимание на эту общую проблему ИИ, стиль автора очень узнается!

Паттерны

В искусстве случайности и ошибки часто становятся спасением, очаровательной деталью или вовсе — гвоздем программы.

Нагромождение деталей, хаотичность, алогичность, отсутствие сюжета — эти ошибки модели тоже имеют право превратиться в преимущества. Например, в паттерне!

Я попросила свою модель создать несколько паттернов, и стиль Кацусики Хокусая раскрылся с абсолютно новой стороны.

Original size 1074x1077

prompt = «a photo of KACUKAI style, a floral pattern»

Original size 1078x1083

prompt = «a photo of KACUKAI style, a winter pattern»

Модель идеально уловила настроение и эстетику автора. Когда смотришь на эти паттерны, мгновенно считываешь стиль японского художника. Тем не менее сам он паттерны не создавал!

Слева prompt = «a photo of KACUKAI style, a pattern of trees and sea» Справа prompt = «a photo of KACUKAI style, a pattern of girls and umbrellas»

Слева prompt = «a photo of KACUKAI style, a pattern of trees and people» Справа prompt = «a photo of KACUKAI style, a pattern of spring games»

К тому же паттерн — идеально подходит для создания дизайнов, а значит цель более чем достигнута.

Original size 4600x2250
Original size 4300x2168
Original size 3984x2226

3. Выводы

У меня получилось не только обучить нейросеть создавать изображения в стиле японского художника Кацусики Хокусая, но и раскрыть стиль автора с совершенно неожиданной для себя стороны. Неспроста «Большая волна в Канагаве» стала так популярна для изображения на мерче. Нейросеть раскрыла потенциал картин Хокусая быть использованными в качестве паттернов.

Я более чем довольна результатом!

Паттерны в стиле Кацусики Хокусая
5