Original size 1240x1750

Обучение генеративной нейросети под стиль Gacha Life

PROTECT STATUS: not protected
0

Концепция

Gacha Life — это компьютерная ролевая игра, в которой есть возможность создать своего персонажа и играть от его лица. У игры есть узнаваемая стилистика, которой я обучила нейросеть. Датасет состоял из 14 изображений. Он послужил основой для серии картинок с вариациями персонажей по запросам.

0

Примеры персонажей из игры, созданные игроками

Общий стиль — аниме и чиби персонажи, с разными атрибутами, такими как одежда, цвет глаз, цвет и форма волос. Каждую составляющую можно выбрать из списка и создать желаемый образ.

Процесс обучения

Для обучения нейросети я использовала Google Colab. Я ориентировалась на лекцию из курса и пошагово написала код.

Первым делом я загрузила датасет в Google Colab и установила необходимые библиотеки.

Original size 1983x1373
Original size 1983x948

После этого я посмотрела превью загруженных картинок.

Original size 1983x474

Я запустила BLIP чтобы он сгенерировал подписи к картинкам из датасета.

Original size 1983x1031

BLIP описал картинки и я добавила к ними «art in GACHA LIFE style» для дальнейшей работы.

Original size 1983x884
Original size 1983x1236
Original size 1983x1295

Дальше прошел главный процесс — обучение модели. Я воспользовалась токеном с HuggingFace, а после ждала 40 минут завершения выполнения кода.

Original size 1983x1601

После я успешно сгенерировала первое изображение, подтвердив работу модели.

Original size 1983x1194

Итоговые изображения

Я задавала нейросети различные промпты, чтобы автоматически создать задуманного персонажа. В целом, программа справлялась отлично, особенно учитывая, что датасет был небольшим.

Original size 1024x1024

Промпт: «art in GACHA LIFE style, boy dragon»

Original size 1024x1024

Промпт: «art in GACHA LIFE style, angel and demon»

Original size 1024x1024

Промпт: «art in GACHA LIFE style, boy with cat ears, black clothes and chains»

Для разнообразия я попробовала дать нейросети имя уже существующего персонажа, чтобы проверить, что она будет делать, если не распознает запрос. Результат не похож на заданного персонажа, но искусственный интеллект не сломался и сгенерировал рандомного мальчика.

Original size 1024x1024

Промпт: «art in GACHA LIFE style, Nagito Komaeda»

После неудачи я решила описать того же персонажа в промпте, чтобы посмотреть, сделает ли нейросеть что-то похожее на оригинал. Я сделала две генерации по одному промпту, результат очень отдалённо напоминает оригинал, что было ожидаемо. Также нейросеть почему-то добавила хвост.

0

Промпт: «art in GACHA LIFE style, boy with curly long white hair, green eyes, green coat, black pants and a smirk on his face»

После я снова описала уже существующего персонажа, на этот раз другого, чтобы проверить реакцию на более сложные запросы. Результат совсем не похож на оригинал.

Original size 1024x1024

Промпт: «art in GACHA LIFE style, rockstar girl with pink blue white and black hair colour»

Далее я генерировала уже привычные промпты без экспериментов.

Original size 1024x1024

Промпт: «art in GACHA LIFE style, angel dog boy»

Original size 1024x1024

Промпт: «art in GACHA LIFE style, demon cat girl»

Следующие два изображения показали, что нейросеть не может совмещать образы и менять цвет кожи на заданный.

Original size 1024x1024

Промпт: «art in GACHA LIFE style, demon and angel girl with halo, heterochromia and rainbow hair»

Original size 1024x1024

Промпт: «art in GACHA LIFE style, girl with blue skin and red hair»

Итог

Генеративная модель справилась с задачей и подстроилась под характерный стиль персонажей Gacha Life. Она не смогла генерировать сложные запросы, такие как изменение цвета кожи или персонаж по имени, но в остальном отражала заданные запросы. У ИИ получилось работать качественно даже с небольшим датасетом, так что программа настроена хорошо и при дополнении данных может развиться в лучшую версию себя.

Нейросеть также справилась с изображением двух персонажей на картинке, хотя в датасете таких примеров не было. В остальном она опиралась на стилистику и вариации оригинала.

Использованные генеративные нейросети

BLIP — https://huggingface.co/docs/transformers/model_doc/blip. Для генерации подписей к картинкам.

HuggingFace — https://huggingface.co. Для генерация токена для обучения модели, её загрузки на сайт.

Stable Diffusion — https://stability.ai/. Для обучения генеративной модели на датасете.

Обучение генеративной нейросети под стиль Gacha Life
0