Original size 1140x1600

Обучение генеративной нейросети под эстетику «русской тоски»

PROTECT STATUS: not protected

Описание проекта

За основу проекта я решила взять не стиль конкретного художника, а некую эстетику, общую атмосферу изображений, которая мне сильно откликается. Я назвала ее эстетикой «Русской тоски». Изображениям подобного характера присущи такие черты как: темные и мрачные тона, изображение привычной нам обыденности. Иногда в таких изображениях встречаются нереалистичные гиперболизированные сюжеты, что только усиливает ощущение той самой «тоски» Это могут быть как картины каких-то художников, так и креативные фотографии.

big
Original size 1961x1143

Фотография сделанная мной, передающая, на мой взгляд, атмосферу и эстетику проекта

Я собрала около ста изображений в заданной стилистике и отформатировала их до одинакового размера (512×512) в Figma. Затем сохранила для дальнейшей загрузки в датасет

big
Original size 907x880

Изображения в Figma

Изображения для анализа

Изображения для анализа

Изображения для анализа

Процесс работы

После установки всех необходимых бибилиотек и подготовки рабочей среды необходимо загрузить изображения

Original size 953x465

Загрузка изображений

Original size 1720x534

Превью

Затем необходимо было задать определенное название моему стилю, по которому программа узнавала бы в какой стилистике нужно создавать изображения

Original size 1788x404

После чего нейросеть проанализировала все изображения из датасета и дала им описание

Original size 1489x426

Затем модель начала свое обучение, которое проходило около часа

Original size 1804x720

Обучение модели

По окончание обучения, я получила модель готовую к работе. Осталось лишь прописать промт для своих изображений и приступить к генерации

Original size 1308x576

Обученная модель

Далее в коде я добавляла к префиксу «photo collage in RUSSTOSKA style» дополнительный промт для создания конкретного изображения. Далее я представлю изображения которые у меня получились + их промт

Итоговые изображения

Original size 1024x1024

«photo collage in RUSSTOSKA style, a residential area of Moscow, with a large skeleton with glowing eyes in the background»

Original size 1024x1024

«photo collage in RUSSTOSKA style, A woman in a red Russian folk costume sits on a tree in cloudy weather»

Original size 1024x1024

«photo collage in RUSSTOSKA style, an empty field, in the middle stands a man in a gas mask and holding flowers in his hands»

Original size 1024x1024

«photo collage in RUSSTOSKA style, a residential area of the city, against the background of a metallurgical plant, the sky is bright pink sunset, a Moskvich car is driving along the road»

Original size 1024x1024

«photo collage in RUSSTOSKA style, Three boys are standing in an adidas tracksuit in the courtyard.»

Итоги и выводы

По итогу работы я получила серию достаточно качественных изображений, которые вполне соответствуют прописанному промту, и что не менее важно, соответствуют заданному стилю. Конечно, нельзя не заметить, что нейросеть плохо справлялась с мелкими деталями (в основном с лицами) Однако, я предполагаю, что если в обучении модели поставить большее количество шагов и заложить больше времени, эту проблему можно решить.

Какие я выводы сделала для себя? Я думаю, что данная модель может быть очень полезна мне как художнику. Я могу задавать параметры стилистики для модели и генерировать идеи изображений, которые в дальнейшем смогу доработать. Я бы это назвала усовершенствованным способом поиска референсов и вдохновения.

Обучение генеративной нейросети под эстетику «русской тоски»