
Концепция
Данный проект посвящён обучению Stable Diffusion и его применению для создания новых изображений. В качестве основы я решила использовать мультфильм Губка Боб, с его несомненно необычайным стилем
Исходные изображения
Мультфильм Губка Боб имеет яркие, насыщенные цвета и уникальные персонажи с простыми, но запоминающимися формами. Губка Боб сам по себе — квадратный, что сразу выделяет его на фоне других мультфильмов






Код
Всю работу я проделала в среде разработки Google Colab, поскольку здесь можно поработать с GPU, что является необходимым для обучения генеративной модели
Установка необходимых библиотек
Всего в собранном датасете было 17 иллюстраций
Вывод миниатюр изображений для проверки корректной загрузки
Hugging Face
Далее я приступила к обучению модели
Обучение модели
После я выгрузила свою уже обученную модель на Hugging Face
Загрузка модели на Hugging Face
Полученные изображения
Здесь вышел неплохой паттерн, нейросеть сохранила основные цвета, но возникли с проблемой формы, также некоторые медузы похожи больше на сухарики


Здесь явно нарушены пропорции, одни из неудачных изображений. цвета и в целом узнаваемость губки есть, но сгенерированы дополнительные конечности и элементы, которые выбиваются из общей картины


Эти фотографии получились более качественными, сохранилась форма главного героя, его одежда, но появились также лишние детали. Также смутил фон, в некоторых изображениях, очень непонятные образы, но это можно отнести к старой рисовке мультфильма, когда контур был более жирным и расплывчатым, а фон мог оставаться одноцветным