Книга рисующих нейросетей - Максим Андреевич Далин
- Название:Книга рисующих нейросетей
-
Автор:Максим Андреевич Далин
- Жанр:Разная литература
- Дата добавления:25 ноябрь 2023
-
Страниц:10
- Просмотры:0
Краткое содержание книги
Шрифт:
Интервал:
Закладка:
Макс Далин
Книга рисующих нейросетей
Пролог
(диалог в бложике, посвящённом сабжу)
Вайми:
— Обычную картину тоже рисует не человек, а кисточка:)
Михаил Эм:
— А кто кисточку направляет?
Вайми:
— Художник.
Михаил Эм:
— Это вы сказали.
Макс:
— А промты для нейросети кто пишет?))
Михаил Эм:
— Промты — пользователь, а саму нейросеть — программист. И какое отношение он имеет к живописи?
Макс:
— Ну ей-богу… а кисточку сделали на фабрике. Какое они там имеют отношение к живописи?
Михаил Эм:
— Ха-ха… Вы еще скажите, какое отношение к «Тайной вечере» имеет Леонардо, если заказчиком выступал Лодовико Сфорца? Промт его.
Макс:
— Не-а. Сфорца сформулировал не промт, а заказ. Сейчас объясню.
Ну, допустим, Леонардо — это оператор нейросети. А Сфорца — человек, которому нужна иллюстрация к новому изданию Библии. И вот он приходит к Леонардо и говорит: мне бы Тайную Вечерю нарисовать. Чтоб там были все апостолы, Господь, всякие разные символы и смыслы — и долго перечисляет, какие конкретно смыслы. И Леонардо говорит: хорошо. Тема сложная, уйдёт, может, неделя, может, больше.
Потом Сфорца уходит. А Леонардо садится думать. И думает примерно так:
— Хм-м… ну, эта сетка просто не потянет. Эта — может, но фактура слишком зализанная, глянцевая… для дешёвого издания — ещё туда-сюда, но для этого — грубо будет. Эта сеточка хорошо берёт анатомию, но съест цвет… а попробуем сделать пару эскизов.
Пишет промт. Делает пару, ещё пару и ещё двадцать штук. Смотрит.
— Целиком не потянет, надо разбивать на фрагменты, потом совмещать. Плащ у Господа очень однотонный вышел, плоский, а Иуда всё время в фокусе света, надо как-то тень там выставить.
Переписывает промт двадцатый раз.
— Ну вот, теперь и Господь в тени. Зато плащ красивый… эх…
Переходит в другую нейросеть. Использует тот же промт, выходит плоско. Леонардо заваривает кофе, пьёт и про себя ругается матом. Переписывает промт в пятидесятый раз. Господь наконец выходит хорошо — и Леонардо его вырезает, потому что оставить нельзя: все остальные не просто тёмные, а с глюками, и рук у них многовато на брата.
Леонардо плюёт и прописывает отдельный промт для каждого апостола.
Получает двенадцать отдельных картинок довольно приличного качества. Они не совмещаются.
Леонардо плачет, матерится, заваривает ещё кофе, думает.
Переписывает стиль.
Нейросеть внезапно переходит на аниме. Леонардо ржёт — и чувствует, что можно работать дальше.
И вот так — примерно весь месяц. К концу месяца он собирает «Тайную Вечерю» из сотни удачных фрагментов, обрабатывает в пайнте, потом в фотошопе, потом снова в пайнте, пропускает через три редактора, улучшает качество, восстанавливает фактуру. Отчаявшись и убившись о боди-редакторы, рисует от руки глаза Господа. Выдыхает.
Показывает заказчику.
Заказчик бегло осматривает.
— Ну да, — говорит он, — вроде ничего. Конечно, нейросетевой рисунок… Механический… Но более-менее, ладно. Сойдёт.
Про нейросеть «Проблембо»
Хорошая нейросеть:)
По просьбам коллег, которым надо генерировать картинки для обложек и иллюстрации — такой миниобзорчик. Про саму нейросеть — вот она: https://problembo.com/ru/services/ai-image-generator — и её особые возможности.
Выношу на видное место: нейросеть платная. Вернее, есть бесплатные попытки — но их немного. Стоит совсем недорого, оплатить не сложнее, чем книгу на АТ купить — но платная, обратите внимание.
На самом деле — очень хорошая. Из всех, что пробовал, нравится мне особенно. Умеет не только генерировать картинки, но и улучшать разрешение нечётких фоток, восстанавливая детали. Поэтому можно с её помощью доделывать и картинки с плохим разрешением, и доводить до ума что-то размытое. Пользоваться очень просто: грузишь фотку (https://problembo.com/ru/services/image-ai-upscale) — и через минуту скачиваешь результат.
Вот так выходит, если сравнить картинку, собранную из набросков в Кандинском, без обработки и с обработкой:
1 (чистая)
2 (обработанная): чтобы понять разницу, посмотрите на разрешение картинок
У Проблембо вообще довольно много функций. Нажимаете в верхней строке на «Сервисы» — и можно со всей пачкой познакомиться: https://problembo.com/ru/services. Я пробовал не всё, но мало ли, кому и что может понадобиться.
А изображения Проблембо генерирует с помощью четырёх моделей, причём промт берёт и на английском, и на русском языке. И хорошо таки понимает русский язык, хотя у меня и сложилось впечатление, что английский всё-таки чуть лучше. Во всяком случае, если машина вдруг что-то налажала после русского промта, есть смысл его на английский перевести — бывает, что хорошо исправляет ошибки.
Особо скажу: у Проблембо есть функция «отрицательная подсказка» — и важно её заполнять, генерируя изображения живых существ. Берёт хорошо и учитывает. Особо рекомендую что-то наподобие «деформированные руки, лишние пальцы, лишние конечности» — реально помогает.
О моделях. Чем сложнее модель — тем дольше Проблембо рисует. Поэтому если вы берёте модель Миджорни — это она не зависла, это она генерирует помаленечку. Иногда минуту-полторы генерирует. Все остальные модели — практически сразу. Но, конечно, и в качестве серьёзная разница, прямо заметная.
Ну вот например. Стимпанковская барышня в викторианском антураже — просто чтобы было легче сравнить.
1. Модель DreamDraw
Всегда будет анимешная. Но качество хорошее, если сам стиль устраивает.
2. Модель RealRender
Якобы реалистично, но, по-моему, сильно на любителя.
3. Модель MidJourney
Тут всегда будет точнее, тут всегда будет интереснее — и чётче соблюдается задание. Но, как я понимаю, эта модель теперь целиком платная. (Хотя стоит совсем недорого и заплатить просто — не сложнее, чем книжку на Литресе или АТ купить).
4. Модель PhotoStab
Она фотореалистичная и довольно интересная, но неточная.
С моей точки зрения, попадает в промт полностью только ДримДрав и Мидждорни, остальные — как повезёт. Поэтому я использую именно эти две модели обычно.
Теоретически у Проблембо есть ещё функция «исходное изображение» — но на неё надежды нет. Все мои пробы тут — мимо: референса она просто не видит и не учитывает.
Генерирует изображения людей и животных, с моей точки зрения, просто отлично. Если указывать эмоции и описывать черты характера — совершенно блистательные бывают попадания, поэтому хороша, когда хотите