Original size 2480x3500

Обучение генеративной нейросети на персонаже мультфильма

PROTECT STATUS: not protected
The project is taking part in the competition

Концепция

Нейросеть обучается на моем любимом с детства персонаже мультфильма. Изучая ее индивидуальные черты, цветовую палитру, фактуру линий графики, характер и мимику, мне показалось интересным поэкспериментировать и создать генерации под запрос учебного проекта.

Главной целью является не только передать схожесть стилистики рисовки, но и сделать изображение с хорошим визуалом.

Ниже представлены некоторые изображения, вошедшие в базу данных для обучения искусственного интеллекта.

big
Original size 3645x1271

Полезные с точки зрения разной позиции, мимики:

big
Original size 1808x530

Полезные с точки зрения передачи стилистики, настроения:

Далее идет серия изображений, полученных в результате обучения нейросети генерировать изображения, основываясь на персонаже мультфильма.

Серия изображений

big
Original size 3152x1024

Промты: «nyusha_smesharik cartoon pig, space explorer, wearing astronaut helmet», «nyusha_smesharik cartoon pig, with a big gift box», «nyusha_smesharik cartoon pig, gardening»

Original size 1024x1024

Промт: «nyusha_smesharik cartoon pig, fashion designer, holding a tiny dress, surrounded by pink fabric rolls»

Персонаж отличается ярким, узнаваемым стилем, который характеризуется несколькими ключевыми особенностями:

  1. Розовый цвет и его оттенки;
  2. Округлые формы, характерные для персонажей данного мультфильма;
  3. Активная мимика, привлекающий, яркий образ;
  4. В целом веселый, забавный посыл.
Original size 3152x1024

Промты: «nyusha_smesharik cartoon pig, superhero costume», «nyusha_smesharik cartoon pig, thinking pose, chin on hoof», «nyusha_smesharik cartoon pig, ballerina»

Original size 1024x1024

Промт: «nyusha_smesharik cartoon pig, holding a heart, blushing cheeks, romantic mood, soft lighting»

Именно эти черты способствуют уникальности, популярности персонажа, делая сам мультфильм интересным не только для детей, но и для взрослых.

Original size 2088x1024

Промты: «nyusha_smesharik cartoon pig, singing into a microphone, stage lights», «nyusha_smesharik cartoon pig, thinking pose, chin on hoof, pink bow on head, light blue background»

Я думаю, нейросети удалось максимально передать основные особенности персонажа в разных ситуациях. В изображениях можно уловить практически сто процентное попадание в мимику и характер.

Однако, стоит отметить, что где-то ИИ гиперболизировал черты персонажа, исказив их, но в картинках все равно считывается образ.

Original size 3152x1024

Промты: «nyusha_smesharik cartoon pig, scientist», «nyusha_smesharik cartoon pig, lazy day, wearing oversized hoodie», «nyusha_smesharik cartoon pig, embarrassed»

Процесс обучения

  1. Собрала и привела в порядок исходные изображения, подогнала их в формат 1:1;
Original size 1314x225

Загрузка базы данных

  1. Загрузка базы данных в подходящем формате;

  2. Выбор архитектуры нейросети;

Original size 1219x419

Моя база данных

  1. Настройка параметров обучения;

  2. Обучение генератора и дискриминатора;

Original size 1233x440

Настройка параметров перед обучением

  1. Оценка схожести полученных изображений, правки, если есть необходимость.
Original size 1249x225

Написания промта и ожидание готового изображения

Используемые ИИ инструменты

  1. Для генерации промтов был использован ChatGPT;
  2. Perplexity AI — помощь с проблемами с кодом, помощь в концепции;
  3. Remini — улучшения качество изображений.
Обучение генеративной нейросети на персонаже мультфильма
Project created at 24.03.2026