А АSaturday, 8 April 2023

GPT4 - напиши мне портрет.

Всем привет.

AI с выходом GPT4 взорвал интернет новыми возможностями. Пользователи быстро сообразили что можно один умный онлайн-сервис научить как пользоваться другим, чтобы не писать много знаков самому. Другой популярный сервис Midjourney позволяющий генерировать фотографии профессионального качества по текстовому описанию уже грозит оставить без работы сотни иллюстраторов. Но для этого надо уметь составлять такие описания (prompts). Их точность прямо влияет на качество ожидаемого результата. Человеку не очень сведущему в тонкостях фотографии на это понадобится время. 

Однако, как упомянуто выше, есть способ сэкономить: достаточно научить GPT4 этим правилам, чтобы после заказывать фото простой фразой - напиши правила для Midjourney для создания фото "Сальвадор Дали с кошками в стиле киберпанк." И все! Правила какие выдаст GPT4 надо будет переслать в Midjourney копипастом. Вуаля! Ваше фото готово, хотя и правила вы еще не учили).

Как выполнить сам процесс обучения показано здесь.

Хотя и теория вам не помешает. Вот несколько важных правил для составления качественных prompts для Midjourney V5 для генерации вдохновляющих профессиональных фото:

  • используйте полные предложения, а не списки слов или команд. Midjourney V5 лучше понимает естественный язык и может уловить больше нюансов и контекста. Например, вместо "астронавт, плавающий, космос" напишите "Астронавт парит в безграничном космосе".

  • будьте конкретными и детальными в своих описаниях. Midjourney V5 может генерировать более реалистичные и разнообразные изображения, если вы уточните цвета, материалы, освещение, стиль, ракурс и другие параметры. Например, вместо "портрет женщины" напишите "Средний план портрета элегантной женщины с темными волосами и зелеными глазами, одетой в красное платье с белыми полосками, на фоне голубого неба с облаками".

  • избегайте лишних слов или команд, которые могут ухудшить качество изображения. Midjourney V5 имеет более высокое разрешение и динамический диапазон, поэтому не нужно добавлять слова типа высокое разрешение или 8k. Также не нужно повторять одни и те же слова или команды в предложении, так как это может привести к нежелательным эффектам. Например, вместо "Картина маслом синего моря с синими волнами и синим небом" напишите "Картина маслом морского пейзажа с волнами и облаками".

  • используйте изображения или ссылки на изображения для уточнения своего запроса. Midjourney V5 поддерживает функцию image weighting (–iw), которая позволяет задать степень влияния изображения на результат. Вы можете использовать изображения для указания стиля, цветовой гаммы, композиции или других характеристик. Например, вы можете написать "Создайте абстрактную картину на основе этого изображения --iw 0.8" и приложить ссылку на изображение, для этого ссылку необходимо поместить в самом начале prompt и отделить пробелом от остальной части текстового описания.

  • Экспериментируйте с новыми функциями и командами Midjourney V5. Midjourney V5 предлагает множество новых возможностей для генерации изображений, таких как seamless tiling (–tile), wider aspect ratios (–ar), stylization (–stylize), uplighting (–uplight) и другие. Вы можете пробовать разные комбинации и значения этих параметров для получения интересных результатов.

Вот несколько примеров "вылизанных" prompts для Midjourney V5 на тему фотографии на английском:

  • a stylish and iconic 1960’s female influencer, standing confidently on a busy city street. Her outfit is a stunning combination of bold patterns and vivid colors, with a chic pillbox hat perched elegantly on her perfectly coiffed hair. The scene is captured using a classic Leica M3 rangefinder camera, paired with a Summilux 50mm f/1.4 lens, renowned for its exceptional sharpness and ability to render stunning detail. The camera settings are carefully chosen to capture the vibrant energy of the city, with an aperture of f/2.8, ISO 400, and a shutter speed of 1/125 sec. The composition is further enhanced by the soft, natural lighting, which highlights the model’s radiant complexion and adds a warm, timeless feel to the image.

  • a breathtaking aerial photo of the Grand Canyon at sunset, showing the majestic rock formations and the winding Colorado River. The photo is taken with a drone equipped with a Sony Alpha 7R IV camera and a Sony FE 24-70mm f/2.8 GM lens, delivering superb resolution and clarity. The camera settings are optimized for capturing the rich colors and contrasts of the landscape, with an aperture of f/8, ISO 100, and a shutter speed of 1/60 sec. The photo is edited in Lightroom to enhance the shadows, highlights, saturation, and sharpness.

  • a cozy and inviting photo of a rustic cabin in the woods during winter, surrounded by snow-covered trees and mountains. The photo is taken with a Nikon D850 camera and a Nikon AF-S NIKKOR 14-24mm f/2.8G ED lens, offering a wide-angle perspective and excellent low-light performance. The camera settings are adjusted for capturing the warm glow of the cabin lights and the cool tones of the snow, with an aperture of f/4, ISO 800, and a shutter speed of 1/30 sec. The photo is processed in Photoshop to remove any distractions and add some vignetting.

  • an artistic and creative photo of a colorful splash of paint on a white background, resembling an abstract painting. The photo is taken with a Canon EOS R5 camera and a Canon RF 100mm f/2.8L Macro IS USM lens, providing high-speed autofocus and image stabilization. The camera settings are set for freezing the motion of the paint droplets, with an aperture of f/11, ISO 2000, and a shutter speed of 1/4000 sec. The photo is cropped and rotated in post-production to create an interesting composition.

Как добавлять параметры в prompts?

Параметры - это опции, которые добавляются к prompt и меняют то, как генерируется изображение. Параметры могут изменять соотношение сторон изображения, переключать между версиями модели Midjourney, менять апскейлер и многое другое.

Параметры всегда добавляются в конец prompt. Вы можете добавить несколько параметров к каждому prompt.

Параметры начинаются с двойного тире (–), за которым следует название параметра и его значение (если требуется). Например, --ar 2:1 или --chaos 50.

Вы можете использовать сокращенные названия для некоторых параметров. Например, --q вместо --quality или --s вместо --stylize.

Вы можете комбинировать разные параметры для получения разных результатов. Например, --ar 2:1 --chaos 50 --q 2 --stylize 500.

Вы можете использовать специальные параметры для переключения между версиями модели Midjourney или использования альтернативных моделей. Например, --v 5 для использования Midjourney V5 или --niji для использования модели Niji.

Midjourney не умеет генерировать изображения с корректными текстами на них, поэтому необходимо избегать указаний при составлении текстовых описаний, которые бы прямо или косвенно заставляли Midjourney добавлять текст на изображение. Я уверен, что текст вы можете добавить после сами. Если для вас это критично то избегайте в prompts для будущего фото элементов типа витрина магазина или кинотеатра. Midjourney V5 понимает многие языки кроме английского, но решать вам.

Вот примеры нескольких выдающихся prompts для Midjourney V5, генерирующих модную фотографию для журналов в стиле 50-х годов, которые используют в своем составе специальные параметры:

a glamorous and sophisticated 50s fashion magazine cover, featuring a blonde model wearing a red polka dot dress and a white pearl necklace, posing with a smile and holding a red umbrella. The background is a Parisian street with the Eiffel Tower in the distance. The photo is shot with a Hasselblad 500C camera and a Zeiss Planar 80mm f/2.8 lens, giving a medium format quality and a shallow depth of field. The camera settings are f/4, ISO 100, and 1/60 sec. The photo is edited in Photoshop to add some grain, contrast, and saturation --ar 2:3 --stylize 300

и результат:


Еще парочка prompts:

:a retro and chic 50s fashion magazine spread, featuring two models wearing black and white outfits and accessories, inspired by Audrey Hepburn’s style. The models are sitting on a couch in a modern living room, looking at each other with playful expressions. The photo is taken with a Leica M3 camera and a Leitz Summicron 50mm f/2 lens, known for its sharpness and bokeh. The camera settings are f/2.8, ISO 200, and 1/125 sec. The photo is processed in Lightroom to add some vignetting, clarity, and split toning --ar 16:9 --q 2 --uplight

:a colorful and fun 50s fashion magazine collage, featuring three models wearing bright floral dresses and hats, posing in front of different backgrounds. The backgrounds are cut-outs from various magazines and newspapers, creating a contrast between the models and the scenes. The photo is taken with a Polaroid Land Camera Model 95, which produces instant prints with a vintage look. The camera settings are f/8.8, ISO 3000, and 1/60 sec. The photo is scanned and cropped in Photoshop to create a square format --ar 1:1 --chaos 50 --stylize 500.

Дерзайте!

1 comment:

Anonymous said...

К сожалению GPT4 надо будет учить правилам на каждую сессию по новому.

Post a Comment

А что вы думаете по этому поводу?

Версия на печать

Популярное