Обучение генеративной модели aiMordochka на Deziiign

«Пусть машина рисует за меня фурри-коммишки!..» — слова которые не говорил никто и никогда.

Если за меня ИИшка будет рисовать коммишны, может она и зарплату за меня будет получать? А я чем заниматься тогда буду?

Тем не менее, из интереса я всё равно ещё какое-то время назад собирала из своих рисунков датабазу чтобы посмотреть, что на её основе можно генерить.

Датабаза

Исходный размер 1134x643

Датабаза из 160 изображений для обучения модели создаётся на основе моих рисунков с заказами — под творческим псевдонимом amordochka — поэтому модельку я называю aiMordochka.

В датабазу я включаю арты разных лет и разных стилей, стадики, скетчи, процессы — наивно думаю, что возможно это поможет модели как-то лучше понять процесс и подстроиться под мой стиль…

К сожалению, все картинки приходится сильно масштабировать и вводить в квадрат — хотя вообще я рисую в основном вертикальные портреты, и одной из особенностей моего стиля является композиция в листе… К сожалению, приходится этим пренебречь из-за технических особенностей.

Исходный размер 1600x700

Обучение модели

Обучение модели делает на базе готового шаблона на языке Python в Google Collab, используем готовые алгоритмы Stable Duffusion, Dreambooth, LoRA, HuggingFace.

Сначала мы загружаем скрипты, создаём директорию, грузим туда наши картинки и проверяем, что код их видит.

Исходный размер 1600x700

Загружаем скрипт, который анализирует, что изображено на загруженных картинках и сам пишет им промпт — ИИ очень плохо понимает сильную стилизацию, без подготовки сам не распознаёт фанарты и персонажей, описывает промпты достаточно коротко и без деталей.

Пример описаний, которые выглядят особенно общо: — drawing of a woman in a pose — a bunch of different moths — comic strip strip strip strip strip strip strip strip strip strip strip strip strip strip strip strip strip strip strip

Исходный размер 1600x700

Наконец — запускаем обучение модели, которое займёт около двух часов реального времени и сохраняем её в HuggingFace. Теперь можно посмотреть что получилось и приступать собственно к самим генерациям!

Генерации

Исходный размер 1600x700

prompt 'a drawing of a cat with bretzel in USERNAME style, username_style_LoRA, woods, fantasy'

Исходный размер 1600x700

prompt 'a portrait of a furry fox girl in USERNAME style, username_style_LoRA'

Исходный размер 1600x700

prompt 'a woman with sword in USERNAME style, pure white background, fantasy'

Несмотря на то, что судя по коду алгоритм вообще не понимал, что у меня на рисунках, генерации… правда узнаются похожими и в них видно мой стиль.

Конечно, то что генерации в бесплатной модели без дальнейшей обработки выглядят как многорукие и многоглазые монстры это совершенно нормально и ожидаемо.

Исходный размер 1600x700

'furry fox portrait in USERNAME style, fantasy'

Исходный размер 1600x700

'hatsune miku in USERNAME style'

Поскольку я хорошо знаю датабазу — мне очень хорошо видно, когда модель очень заметно пипетит и повторяет цвета и композицию.

Исходный размер 1600x700

prompt 'an anime girl in USERNAME style, fantasy, woods' // мой фанарт на Clover Cookie из CookieRun Kingdom

Исходный размер 1251x700

prompt 'angel girl with wings and halo in USERNAME style, sky background' // мой фанарт на Воскресенье из Honkai StarRail

Можно обратить внимание, что аиМордочку я к сожалению научила халтурить по всем тем схемам, где сама халтурю — почти всегда у персонажей одинаковый поворот головы, хитрая улыбка и подмигивание (чтобы не рисовать второй глаз)… Ну, яблочко от яблоньки, какая датабаза такие и генерации.

Исходный размер 1600x700

prompt 'angel girl with wings and halo in USERNAME style, sky background'

Исходный размер 1600x700

'hatsune miku in USERNAME style, username_style_LoRA'

Исходный размер 1600x700

'catgirl sitting in the woods in USERNAME style, fantasy'

Исходный размер 1600x700

'an anime girl in USERNAME style, fantasy, woods, username_style_LoRA'

Ну и главная трагедия — нейросоня как и настоящая соня оказалась невероятно ленивой и не была готова работать два дня подряд.

На следующий день при перезагрузке модели она почему-то перестала делать портреты и начала просто выдавать какие-то серые артефакты: ( Ну ладно, устала, до этого хорошо поработала, пусть отдыхает до следующих модификаций.

Исходный размер 1600x700

a drawing of an anime girl in USERNAME style, username_style_LoRA

Исходный размер 1226x700

Блокнот с кодом