Обучение генеративной модели стилю спанчбоба на Deziiign

Концепция

Данный проект посвящён обучению Stable Diffusion и его применению для создания новых изображений. В качестве основы я решила использовать мультфильм Губка Боб, с его несомненно необычайным стилем

Исходные изображения

Мультфильм Губка Боб имеет яркие, насыщенные цвета и уникальные персонажи с простыми, но запоминающимися формами. Губка Боб сам по себе — квадратный, что сразу выделяет его на фоне других мультфильмов

Код

Всю работу я проделала в среде разработки Google Colab, поскольку здесь можно поработать с GPU, что является необходимым для обучения генеративной модели

Установка необходимых библиотек

Всего в собранном датасете было 17 иллюстраций

Вывод миниатюр изображений для проверки корректной загрузки

Исходный размер 1145x199

Hugging Face

Далее я приступила к обучению модели

Исходный размер 876x758

Обучение модели

После я выгрузила свою уже обученную модель на Hugging Face

Загрузка модели на Hugging Face

Полученные изображения

Исходный размер 1024x1024

Здесь вышел неплохой паттерн, нейросеть сохранила основные цвета, но возникли с проблемой формы, также некоторые медузы похожи больше на сухарики

Здесь явно нарушены пропорции, одни из неудачных изображений. цвета и в целом узнаваемость губки есть, но сгенерированы дополнительные конечности и элементы, которые выбиваются из общей картины

Исходный размер 1024x1024

Эти фотографии получились более качественными, сохранилась форма главного героя, его одежда, но появились также лишние детали. Также смутил фон, в некоторых изображениях, очень непонятные образы, но это можно отнести к старой рисовке мультфильма, когда контур был более жирным и расплывчатым, а фон мог оставаться одноцветным

Код и архив