Всем привет.
Заметно что дизайнеры, художники, иллюстраторы и даже web-фрики плотно подсели на ИИ в виде генератора картинок из текста (txt2img). И это, конечно, повысит в интернете уровень графического шума и количество охочих подзаработать на халяву. Пока те кто платят за такое художество не сообразят что подобное можно легко делать и самим. Ну да ладно, коммерческий аспект свободного применения ИИ оставим на потом.
Сегодня пару слов про использование метаданных в таких картинках которые выходят в результате из под, например, Stable Diffusion. Итак, насколько нам известно для генерации картинки 1 в 1 как у выбранного популярного автора, надо соблюсти ряд условий, т.е. правильно указать: модель, семплер, количество шагов, CFG и seed. Размер картинки или хотя бы соотношение сторон тоже имеет значение. Но самое главное это промт! Как позитивный так и негативный. И вот все это богатство надо запомнить на будущее. Но где?
Чтобы было удобно не копировать или менять за картинкой еще и файл условий ее генерации (все перечисленное выше) разработчики GUI для Stable Diffusion решили их писать в блок метаданных самой картинки. Да да, в тот самый EXIF.
Но тут случился казус присущий всему бесплатному - каждый решил что он будет писать промт и прочее туда куда он посчитает удобным. Например AUTOMATIC1111 пишет все в секцию EXIF-комментариев.
А вот ComfyUI пишет в..., а не знаю я куда он свое пишет. Видимо тут сыграло злую штуку то что ему кроме промта и прочих параметров надо писать еще и все координаты workflow. Короче информация такая в картинке есть, и ComfyUI ее читает, но вот обыкновенный EXIF-ридер ее уже не видит.
Хотя вот есть такой SD Prompt Reader который что-то может извлечь, но и то не всегда. Он также написан энтузиастом и тоже подвержен багам.
Учитывая темпы развития подобных инструментов мы будет еще долго пожинать плоды фривольности бесплатного софта.
Удачи всем.
No comments:
Post a Comment
А что вы думаете по этому поводу?