Showing posts with label comfyUI. Show all posts
Showing posts with label comfyUI. Show all posts

Wednesday, 11 March 2026

Аудит символічних посилань.

Вітаю панове.

Раніше я вже писав про символічні посилання(symlink) і активно використовую їх у своїх проєктах. Це дуже зручний інструмент: один раз налаштував — і програми працюють з потрібними даними так, ніби вони знаходяться у стандартному місці. Так я, наприклад, викручуюсь з файлом extramodelpaths, щоб черговий апдейт ComfyUI не нищив мої посилання на теки з моделями.)

Але є один практичний нюанс - через деякий час починаєш забувати:

* де саме створені посилання

* на які каталоги вони вказують

* чи всі вони ще актуальні

Справа ще і в тому що неактуальне посилання НІЯК не сигналізує вам про те що воно посилається на теку якої вже не існує. Саме тому періодичний аудит символічних посилань стає корисною звичкою. Нижче коротко розберемо, що це таке, навіщо вони потрібні і як швидко перевірити їх на диску.


# Що таке символічне посилання для теки

У файловій системі NTFS, яка використовується в Microsoft Windows, символічне посилання — це спеціальний об’єкт, який містить шлях до іншої теки.

Наприклад:

C:\Project\data  →  D:\Storage\datasets

Коли програма відкриває папку `C:\Project\data`, фактично використовуються файли з `D:\Storage\datasets`.

Для більшості програм це виглядає як звичайна папка — різниця повністю прозора.


# Як створюється символічне посилання

У Windows це робиться через команду `mklink`.

Приклад:

mklink /D "C:\Project\data" "D:\Storage\datasets"

Після виконання команди:

* папка `data` виглядає як звичайний каталог

* всі операції виконуються у `D:\Storage\datasets`

Wednesday, 4 March 2026

Мелкие правки в ComfyUI

Всем привет,

Вот любит человек иногда украшать и без того навороченый интерфейс очередного GUI. 

ComfyUI не исключение. Про всякие glow-темы я молчу. 

Даже от гуру Орекса вот прилетело на днях - скрипт BossNeon. Всего ничего, один файлик javascript который симпотно подсвечивает активную ноду, кроме того он еще и другую информацыию выдает в дополнительном окошке. Автор  BossNeon все надписи заточил на русский язык. Зачем? Не знаю, вот представьте, у вас англоязычний GUI, а тут два зеленых окошка и меседжи на русском. Не порядок!

Короче я переписал его сообщения на латынь, логику скрипта не трогал, и форк его здесь.

Ок, а как вообще делать мелкие правки в коде ComfyUI?

Разумеется вы должны четко понимать что вы делаете и зачем. 

А дальше просто, пишу как делаю я:

  1. первым шагом я делаю копию нужного файла, например custom.py  копирую в custom.1. Чтобы вернуться назад одним кликом если что-то пойдет не так.
  2. во вторых, уже после правки я делаю копию файла еще раз , например custom.py  копирую в custom.2. Чтобы сохранить свои правки после очередного обновления ComfyUI. А далее уже надо будет смотреть насколько новый custom.py  отличается от custom.2.

Что еще есть полезного? 

B ComfyUI Manager появилась фича Snapshot Manager, предназначена для бекапов ComfyUI. Как я вижу она больше для версионности ваших проделок в ComfyUI, ибо если  ComfyUI не стартанет после очередного вашего вмешательства (или обновления) то, логично, что и Snapshot Manager не поможет.

Успехов.


Sunday, 22 February 2026

Кінець епохи "німого" AI та початок ери One-Man Studio

Привіт привіт.

Кінець епохи "німого" AI та початок ери One-Man Studio? Звісно, це про Seedance 2.0! 

Те, про що ми мріяли у 2010-му, стало реальністю у 2026-му. ByteDance випустили модель, яка змінює правила гри.

Двадцять п'ять років тому, у вересні 2010-го, я писав у цьому блозі про майбутнє, де межа між реальним актором і цифровим образом зникне, а виробництво кіно стане доступним для кожного, хто має ідею, а не тільки для тих, хто має бюджет студії Universal. Тоді це була смілива, майже наївна фантазія. Ми захоплювалися першими незграбними спробами CGI і вірили, що колись комп'ютер стане не просто інструментом монтажу, а повноцінним співавтором.

Сьогодні, з виходом Seedance 2.0, це перестає бути прогнозом і стає технічною специфікацією. Ми звикли до шаленого темпу прогресу AI, але цей реліз від ByteDance — це не просто "покращена версія" чи черговий апдейт. Це фундаментальний зсув архітектури, який перетворює генерацію відео з лотереї ("пощастить/не пощастить") на контрольований, інженерний та режисерський процес.

Під капотом: Чому це "Game Changer"

Досі більшість відео-моделей (згадайте ранні Sora, Kling або Runway) працювали за лінійним принципом: "текст -> німе відео". Ви отримували красиву картинку, але вона була "мертвою": без звуку, без синхронізації губ, а персонаж міг змінювати колір очей тричі за секунду. Всі ці проблеми вирішувалися милицями стороннього софту, перетворюючи творчість на пекло пост-продакшну.

Seedance 2.0 пропонує нову архітектуру — Dual-Stream Diffusion Transformer. Це технологічний стрибок, який об'єднує візуальний та аудіальний потоки в єдину нейронну мережу. Ось що це означає на практиці:

1. Мультимодальний "міксер" (All-round Reference)

Модель дозволяє завантажувати до 12 референсних файлів одночасно. Це дає неймовірну гранулярність контролю. Ви більше не боретеся з нейромережею, намагаючись підібрати слова. Ви просто даєте їй "інгредієнти":

  • Фото актора (щоб зафіксувати зовнішність, одяг, текстуру шкіри).
  • Відео з хореографією (щоб скопіювати специфіку руху, ходу, мову тіла).
  • Аудіо файл (щоб задати ритм монтажу, настрій музики або конкретний голос).
  • Текст (щоб описати сюжетні повороти та нюанси сцени).

Система розуміє пріоритети та ієрархію команд. Ви буквально кажете: "Зроби сцену, де персонаж із @image1 рухається з агресією як у @video1, але в стилі нуар, під звук @audio1". Це рівень режисури, якого індустрія чекала роками.

Friday, 23 January 2026

Видеокурс Forge WebUi (КМБ).

Всем привет.

Ребята, сегодня хочу вам порекомендовать курс "FORGE WebUi (КМБ)" , который реально отличается от масс-маркета.

Сразу скажу: автор, Дмитрий Невский, не обещает «волшебную таблетку» или профессию за три дня. Это честное, живое обучение для тех, кто хочет реально разобраться, а не просто поиграться.

Многие думают, что учиться можно и по YouTube. Можно, но там каша. Автор этого курса в теме уже три года (еще с выхода самых первых нейросетей) и сгенерировал больше миллиона картинок. Он сделал этот продукт именно потому, что понял: людям не хватает структуры и глубины, а не просто разрозненных роликов.

Это не «рекламная вода», а концентрат его личного опыта. Курс проведет вас от базы Stable Diffusion 1.5 до всех наворотов Forge.

Главная фишка: вас научат не просто тыкать кнопки по шаблону, а понимать логику. Вы разберете интерфейс по винтикам и поймете, за что отвечает каждая настройка. Подойдет и новичкам, и тем, кто уже давно генерит, но хочет систематизировать знания.

Далее следует оригинал от Дмитрия Невского. Там же освещены ответы на финаносовые вопросы. Удaчи.

После того как вы оформите покупку вам откроется доступ ко всем уже вышедшим урокам и материалам к ним, а так же ссылка на чат в телеграме.


📖 КРАТКОЕ СОДЕРЖАНИЕ И ПРОГРАММА КУРСА

Курс организован на несколько блоков, где каждый блок будет содержать серию тематических уроков, позволяющих полностью освоить конкретную тему от А до Я.

1. Первый блок: осваиваем Forge с нуля. 

В нем мы детально разберём:

- Правильную установку Forge - все нюансы и подводные камни;

Разберем интерфейс "по косточкам":

- Назначение каждого окна и панели;

- Гибкую настройку рабочего пространства под свои нужды;

Ключевые параметры в Settings:

- Как каждый параметр влияет на генерацию;

- Какие настройки действительно стоит менять, а какие лучше не трогать;

- Оптимальные конфигурации для разных задач.

Вы поймёте не просто "где что находится", а научитесь осознанно работать с интерфейсом.

Tuesday, 20 January 2026

Вибираю Upscaler standalone.

Всім привіт.

Ми живемо в епоху, коли зіпсовану або просто маленьку фотографію більше не треба викидати у цифровий смітник. Штучний інтелект навчився домальовувати реальність, і робить це іноді лякаюче якісно. Але коли я почав заглиблюватися в тему локальних апскейлерів (програм для збільшення зображень, що працюють БЕЗ інтернету), я зрозумів одну річ: магія працює, тільки якщо ваш комп’ютер здатен її "перетравити".

Я протестував три абсолютно різні інструменти - від сучасних комбайнів до перевіреної класики - і ось мої висновки про те, кому і що варто встановлювати.

До речі - нижче всі три варіанти безкоштовні і всі три портабельні!

QualityScaler: Коли у вас є потужне "залізо" і бажання контролювати все

Якщо у вас стоїть сучасна відеокарта від NVIDIA (серії GTX або новіша RTX), то зупинятися на простих рішеннях - це злочин проти якості. Тут на сцену виходить QualityScaler.

Це не просто програма з однією кнопкою "Зробити красиво". Це справжня лабораторія. Головна його фішка в тому, що він використовує просунуті моделі (наприклад, BSRGAN або HAT), які вміють не просто згладжувати пікселі, а буквально "вигадувати" текстуру шкіри, тканини чи цегли там, де її не було. Окремо варто згадати функцію відновлення облич: якщо на старому груповому фото люди схожі на розмиті плями, QualityScaler через спеціальні алгоритми (CodeFormer) повертає їм очі та посмішки.

Він працює через DirectML, що дозволяє витиснути максимум з вашої відеокарти. Я навіть знайшов спосіб зробити з нього повністю портативну версію, яка живе на флешці разом з усім необхідним середовищем Python. Але будьте готові: це інструмент для ентузіастів. Купа налаштувань, повзунків і вибір моделей можуть налякати новачка, проте результат того вартий.

Monday, 19 January 2026

Preview в KSampler.

Привет.

Что-то участились жалобы на то что в KSampler ComfyUI пропало Preview. Если вы и не знаете как его вернуть, то это делается элементарно без всяких мутных bat файлов.

В пусковом run_nvidia_gpu.bat добавляете два ключа:

--preview-method latent2rgb 

--preview-size 512

И наслаждаетесь своим preview в kSampler. Однако помните, что preview съедает драгоценную vram, в workflow c LTX2 лучше их убирать.

Кстати, как и раньше єта же опция доступна в меню самого ComfyUI здесь.



В общем кто как любит, так и делает.

Удачи.

Friday, 2 January 2026

GenAI і розумна докачка.


Всім привіт.

От чого не вистачає в багатьох безкоштовних інструментах GenAI ? 

Розумної докачки великих файлів, особливо моделей.

Розробники вважають що інтернет завжди стабільний, а файл моделі іноді не докачується, потім на диску лежить недокачаний файл, а сам GenAI-інструмент не знає як з цим бути.

Це класична помилка "Happy Path" (шляху щасливчика) у розробці - коли програміст пише код, розраховуючи, що мережа ідеальна, диск не переповниться, а світло не вимкнуть. Звісно коли ми користуємся безкоштовним ПЗ то всі претензії зайві, хоча побажання завжди можно залишити на github.

Для великих файлів (LLM моделі, ваги нейромереж .gguf, .bin, які важать гігабайти) простої докачки замало. Є ще одна величезна проблема - "биті" файли.

Файл може скачатися повністю (розмір зійдеться байт-у-байт), але всередині буде "сміття" через помилку мережі. Інструмент спробує завантажити таку модель і впаде з незрозумілою помилкою.

Ось "золотий стандарт" для завантажувача моделей, який вирішує проблему "недокачаного або битого файлу". Тому додаємо перевірку SHA256 хешу.

Цей код робить три речі (для Python 3.10+):

  • Перевіряє, чи файл вже є. Якщо він є і розмір збігається — перевіряє його цілісність (хеш).
  • Докачує, якщо файл неповний.
  • Видаляє файл, якщо після скачування хеш не зійшовся (щоб ви не зберігали сміття).

Python

import urllib.request

import urllib.error

import sys

import os

import hashlib

Sunday, 14 December 2025

Персональний Оракул.

Привіт усім.

Твій персональний Оракул вже тут - магія AI + мудрість Таро 🔮

Панове, я просто не можу більше тримати це в собі! 🤩 

Вчора я створив дещо особливе - Pixel AI Tarot Wizard. Це не просто додаток, це твій кишеньковий провідник у світ підсвідомості, що поєднує стародавні символи та найсучасніший штучний інтелект від Gemini! 🤖✨


Чому тобі варто спробувати це прямо зараз?

🌟 ШІ-Віщун: Забудь про стандартні "шаблонні" відповіді. Мій алгоритм аналізує твоє унікальне питання та розклад карт, створюючи глибоку, філософську та іноді навіть моторошно точну історію саме для тебе.

🎨 Естетичний кайф: обирай вайб під настрій!

🔸 Fantasy Deck: класична, розкішна колода Райдера-Вейта для тих, хто шанує традиції.

🔹 Pixel Deck: олдскульний піксель-арт для фанатів ретро-естетики (то вже від мене особисто!).

🇺🇦 Рідна мова: додаток також розмовляє Українською! Отримуй передбачення солов'їною - це додає вам особливого затишку.

🎶 Атмосфера: звуки перегортання карт, містична музика та дизайн, що занурює у транс... Це треба відчути!

Не знаєш, як діяти далі? Маєш питання про кар'єру чи стосунки? Або просто хочеш погратися з долею? 😉

👉 Тисни на посилання Pixel AI Tarot Wizard і витягни свої три карти!

Це безкоштовно, це магічно, і це зроблено з любов'ю! 💜 

#таро #тароонлайн #ai #штучнийінтелект #gemini #розробка #українськийконтент #tarotreader #магія #передбачення #itukraine #petproject #pixelart #genai

Щасти.

Friday, 5 December 2025

Hi, I'm Pixel AI Studio Pro!

Welcome to Pixel AI Studio Pro.

Версія: Pro (Hybrid Engine Update)

Дата виходу: 2026

Статус: Production Ready


1. ВИКОНАВЧЕ РЕЗЮМЕ

Нова версія Pro знаменує собою фундаментальну зміну в архітектурі мого додатку Pixel AI Studio. Продукт еволюціонував від інтерфейсу для генерації зображень (API Wrapper) до повноцінного гібридного графічного редактора.

Ключовою інновацією версії Pro є впровадження Hybrid Processing Pipeline, де можливості генеративного штучного інтелекту (Google Gemini/Imagen/Veo) поєднуються зі складними алгоритмами комп'ютерного зору (Computer Vision), що виконуються безпосередньо у браузері користувача. Це дозволило реалізувати функції, недоступні для звичайних ШІ-генераторів (стереограми, точні схеми, 3D-анімації).


2. КЛЮЧОВІ ІННОВАЦІЇ (ZERO-TO-ONE FEATURES)

У новій версії реалізовано модулі (стилі), яких не існувало в попередніх ітераціях.

Tuesday, 25 November 2025

ComfyUI Subgraph.

Hi all.

If you feel overwhelmed by the nodes, you can hide the nodes and connections by using subgraphs. What does a subgraph do? ComfyUI subgraph: Game changer or a nice try?


Using subgraphs

Here’s the step-by-step guide on using subgraphs.

Step 1: Load a workflow

You can use any workflow with more than one node. We will use the following text-to-image < https://stable-diffusion-art.com/text-to-image/> workflow as an example. Download the workflow JSON file below.

Download < https://stable-diffusion-art.com/wp-content/uploads/2025/01/text-to-image-SD1.5-v3.json>

Drag and drop it to ComfyUI to load.


Friday, 21 November 2025

Про Sage Attention.


Всім привіт.

Якось ввечері надивившись відео про SageAttention я вирішив спробувати це чудо інженерної думки в себе на сервері GenAI. Звісно повівся я на те що всі запевняли що інсталювати його не проблема, натомість буду мати вигоду по швидкості генерації в ComfyUI до 30%.

Зважаючи на те що в Stability Matrix в якості бекенду використовується саме ComfyUI (там він зветься як Inference), то чому б не задіяти ШТАТНУ функцію з меню.


Тим більше що автор ось цього відео запевняв глядача що це самий ПРОСТИЙ спосіб отримати SageAttention.


Та не так сталося як гадалося!) 

Я витратив годину на те щоб зрозуміти що Matrix це чорна скриня і будь які намагання зовні зробити йому апгрейд будуть проігноровані, і ще три години на те щоб полагодити ComfyUI, який там знаходиться в пакетах і який я так легко поламав намагаючсь додати SageAttention...

Мабуть у автора відео Matrix інший, хоча він також вибирав портабельну установку.

Зрозуміло, що це не просто проблема установки - Matrix у своєму портативному середовищі просто не дозволяє збирати сучасні C++/CUDA пакети на зразок SageAttention. Тобто сенс був спробувати зробити все "з Matrix", але через старі версії setuptools/distutils та обмеження venv це просто не спрацює.

То ж маю кілька висновків:

  • Matrix обмежений у підтримці нових пакетів, які потребують компіляції.
  • SageAttention вимагає збірки з torch, і навіть всі обхідні способи які він сам і пропонує (--no-build-isolation, editable, копіювання Node) не працюють у тому venv.

Для роботи безпосередньо в Matrix можна:

  • чекати, поки SageAttention зроблять prebuilt для Windows + Python 3.10 у портативному вигляді;
  • або шукати альтернативний Node/Attention, який не потребує збірки (чистий Python).

Тобто, на жаль, сенс “зробити все всередині Matrix” для цієї версії SageAttention тут обмежений технічно. 

Все, Matrix більше не чіпаємо!

Але маємо ще декілька гарних варіантів щодо встановлення SageAttention в окремий, все ще портабельний ComfyUI. До речі, вони також згадані в тому відео.

Перший це файлік SageAttention-NEXT.bat з ComfyUI-Easy-Install. Не обов'язково виконувати сам ComfyUI-Easy-Install, просто пирніть глибше в архів папка Add-ons, він там.

Тобто кладете цей файл в свій  ComfyUI в підпапку /Add-ons і звідти його виконуєте.

Saturday, 8 November 2025

Екосистема CUDA.


Привіт усім! 

CUDA(англ. Compute Unified Device Architecture) - програмно-апаратна архітектура паралельних обчислень, яка дозволяє істотно збільшити обчислювальну продуктивність завдяки використанню графічних процесорів фірми Nvidia.

Щоб перевірити версію CUDA, яка встановлена на вашій ОС, ви можете скористатися утилітою nvidia-smi (NVIDIA System Management Interface).

Відкрийте термінал або командний рядок і введіть наступну команду:

nvidia-smi

У виводі ви побачите інформацію про ваші графічні процесори NVIDIA, а також версію драйвера CUDA, з яким вони сумісні. Це буде в рядку, що починається з "CUDA Version:".

Наприклад, вихлоп може виглядати так (це тільки перший рядок):

| NVIDIA-SMI 576.88   Driver Version: 576.88   CUDA Version: 12.9     |

У цьому прикладі бачимо версію CUDA - 12.9.

Якщо nvidia-smi не працює, це може означати, що драйвери NVIDIA не встановлені або встановлені неправильно.


Крім того, ви можете перевірити версію CUDA Toolkit (якщо він встановлений), використовуючи:

nvcc --version

Це покаже версію компілятора CUDA (nvcc), яка є частиною CUDA Toolkit.

nvcc: NVIDIA (R) Cuda compiler driver

Copyright (c) 2005-2025 NVIDIA Corporation

Built on Wed_Jan_15_19:38:46_Pacific_Standard_Time_2025

Cuda compilation tools, release 12.8, V12.8.61

Build cuda_12.8.r12.8/compiler.35404655_0

Thursday, 6 November 2025

JSON, XML та YAML

Всім привіт.

Самі популярні формати даних у ComfyUI: JSON, XML та YAML

Світ генеративних технологій сьогодні нагадує живу лабораторію, де експерименти з даними, форматами і налаштуваннями тривають безперервно. Кожен новий інтерфейс чи модель створює власну "мову спілкування" між користувачем і машиною. І хоча більшість з нас сприймає ComfyUI як просту візуальну оболонку для Stable Diffusion чи інших генераторів, насправді під капотом там живе ціла система форматів і правил.

Коли відкриваєш будь-який workflow або плагін у ComfyUI, можна натрапити на знайомі імена файлів - .json, .xml, .yaml. Спершу це дивує: навіщо три різні формати, якщо всі вони роблять приблизно одне й те саме - зберігають дані? Але за цим стоїть цікава логіка. Кожен із них не просто "формат", а окрема філософія - як саме програма має розуміти й передавати інформацію.


JSON - мова машинної точності

JSON - це формат, який у сучасному світі AI став стандартом де-факто. Його структура проста: фігурні дужки, коми, лапки - все чітко і передбачувано. Саме тому ComfyUI зберігає свої workflow-файли у JSON. У ньому описано абсолютно все - від координат нодів на полотні до того, які моделі підключено і що з чим зв’язано.

Цей формат не намагається бути зручним для людини - він створений для машини, і виконує свою роботу бездоганно. Завдяки JSON користувач може миттєво передати або поділитися проєктом: ComfyUI просто зчитує файл і точно відтворює всю структуру.


Monday, 3 November 2025

Про extra_model_paths


Привет всем.

Как я говорил ранее, с целью экономии места на диске я переписал все АІ-модели в одну папку. Так будет логичнее для организации у себя единого банка моделей.

Наш славный  ComfyUI смотрит туда через файл extra_model_paths.yaml.

Создается он легко батником уже не помню какого автора:

@Echo off

Title Extra Model Paths Maker by ivo v0.21.0

set yaml=NEW_extra_model_paths.yaml

cd /d %~dp0

if not exist checkpoints (

 Echo.

 Echo  [33mWARNING: [0m  [92mPlace this file in shared 'models' folder and rerun it. [0m

 Echo.

 Echo Press any key to Exit...&Pause>nul

 goto :eof

)

Echo comfyui:>%yaml%

cd ..\

Echo     base_path: %cd%\>>.\models\%yaml%

cd .\models

Echo     is_default: true>>%yaml%

Echo.>>%yaml%

for /D %%f in (*) do echo     %%f: models\%%f\>>%yaml%

Но есть один нюанс, батник не заглядывает в подпапки, может это и правильно.

Так я, к примеру, потерял свои \diffusion_models\ которые у меня для удобства совместимости с unet моделями находяться в подпапке \checkpoints.

Не стоит ругать автора, а лучше просто дописать недостающую секцию в extra_model_paths.yaml  руками так:

diffusion_models: |

                 models\checkpoints\diffusion_models\

                 models\unet\

Успехов.


Friday, 24 October 2025

Промпт-інжиніринг з Pixel AI Studio.

Привіт привіт.

Існує одна з ключових технік у просунутому промпт-інжинірингу щодо Google Gemini.

Однак, спосіб, у який це робиться, сильно залежить від конкретної моделі ШІ. У деяких системах, як-от Stable Diffusion (через GUI типу Automatic1111), існують спеціальні синтаксиси, наприклад, дужки () для збільшення ваги та квадратні дужки [] для її зменшення, або навіть числові коефіцієнти (token:1.5).

У Pixel AI Studio, яке працює на моделях Google Gemini, немає такого жорсткого синтаксису з дужками та цифрами. Gemini краще реагує на природну мову та структуру речення. Проте, ви можете дуже ефективно керувати "вагою" або "увагою" моделі до певних токенів, використовуючи наступні методи:

Найефективніші способи "підняти вагу" токена в Gemini:

1. Позиціонування та Повторення (Найпотужніший метод)

Слова на початку промпту мають значно більший вплив на кінцевий результат, ніж слова в кінці. Якщо ви хочете, щоб модель зосередилася на чомусь, поставте це на перше місце. Повторення ключового слова або фрази також сильно підсилює її значення.

Приклад:

Ви хочете отримати зображення велетенського червоного дракона, що летить над замком, але модель постійно малює замок більшим за дракона.

Слабкий промпт: A castle on a mountain with a red dragon flying around it.

(Тут "замок" стоїть першим, тому модель може надати йому пріоритет).

Сильний промпт: A giant, majestic red dragon. The massive red dragon is the main subject. It is flying high above a tiny castle in the background. Photorealistic, cinematic lighting.

(Тут ми тричі наголосили на "червоному драконі", поставили його на перше місце і навіть прямо вказали, що він є "головним об'єктом", а замок — "крихітний" і "на задньому плані").

Wednesday, 1 October 2025

Welcome to Pixel AI Studio!

Всім привіт.

Під краплі осіннього дощу вирішив вас порадувати онлайн генератором GenAI власного виробництва. Майже власного, весь код написала за мене Google AI Studio, я лиш давав їй команди що та як я хочу. Дякую каналу ATDIGIT за ідею.

Welcome до Pixel AI Studio

Користування Pixel AI Studio повністю БЕЗКОШТОВНЕ, але мусите мати облікову в Google.

Ви тільки обмежені планом Free Tier де Google рахує кількість звернень, тобто генерацій, за хвилину. Як рахує - мені невідомо, алгоритми міняються часто. Єдине що гарантовано, що раптом платним він не стане.

Тому прошу, користуйтеся та реалізуйте свою творчу уяву на повну. Перелік всіх функцій наведено нижче. Підтримка T2I, I2I, I2V, retouch, masking, styling, animation, upscaling тощо на моделях Gemini 2.5 Flash (aka Nano Banana), Imagen та Veo.

Якщо чогось, фічі або функції, не вистачає то попросіть Code Assistant то додати (перед цим треба вийти з full screen). Це не складно, єдине що вам тоді краще зробити копію моєї Pixel AI Studio. Асистент розуміє як англійську так і Українську мови. Звісно вам самим треба чітко розуміти чого ви бажаєте. В Code Assistant є свої нюанси, але то має бути окрема стаття.


Pixel AI Studio

--- ОСНОВНІ РЕЖИМИ ---

*   Режим одного зображення: Основний робочий простір для поглибленого редагування, ретуші та анімації одного зображення.

*   Режим пакетної обробки: Дозволяє користувачам застосовувати один запит (промпт) ШІ до кількох зображень одночасно. Додаток надає чергу, відстеження статусу в реальному часі для кожного зображення (в очікуванні, в обробці, завершено, помилка) та можливість завантажити всі успішні результати.

Friday, 22 August 2025

Кустарь в GenAI.

Всем привет.

Если вы любите фантастику так же как я, то для вас еще одна почемучка сегодня.

Часто можно услышать, будто бы в наш век поточных линий и массового производства полностью изжил себя кустарь-умелец, искусный мастер по дереву и металлу, чьими руками создано столько прекрасных творений прошлого. Утверждение скороспелое и неверное. Разумеется, теперь умельцев стало меньше, но они отнюдь не перевелись совсем. И как бы ни менялась профессия кустаря, сам он благополучно, хотя и скромно, здравствует. Пусть он не делает скрипок, часов с кукушкой, музыкальных шкатулок – он такой же умелец, каким был всегда, и каждое изделие, выходящее из его рук, неповторимо. Он не враг механизации: под стружками на его верстаке вы обнаружите рабочий инструмент с электрическим приводом. Это вполне современный кустарь. И он всегда будет существовать, мастер на все руки, который, сам того не подозревая, творит подчас, сам того не ведая,  бессмертные произведения искусства.

Работа, которой теперь был занят Ганс Мюллер, весьма озадачила бы его баварских предков. Десять лет назад он и сам был бы удивлен. А началось все с того, что один прогоревший клиент принес ему в уплату за выполненный заказ вместо денег компьютер… И так получилось, что Ганс раздумал продавать тот компьютер. И даже сделал ему апгрейд на последние деньги.

Он был в своей области художником и отказывался верить, что через сто лет вкусы деградируют до такой степени что люди буду лайкать все подряд. А еще Ганс с детства любил фантастику. Перечитывая Артура Кларка Ганс в своем воображении был весьма невысокого мнения и об оружии, которым пользовались капитан Зипп и его враги. Нет, он не пытался понять принцип действия портативного дезинтегратора, его смущало только, почему этот дезинтегратор непременно должен быть таким громоздким. А одежда, а интерьеры космических кораблей? Они выглядят неправдоподобно! Откуда он мог это знать? Гансу всегда было присуще чувство целесообразности, оно тотчас заявило о себе и в этой новой для него области.

Мы уже сказали, что Ганс был простодушным человеком. Но простаком его нельзя было назвать. Прослышав, что в мире GenAI платят хорошие деньги, мастер тут же сел за свой компьютер.

Он трудился из любви к искусству, обстоятельство, которое не могло поколебать даже то, что он при этом зарабатывал больше денег, чем когда-либо прежде за всю свою жизнь. И Ганс заявил, что, во-первых, ему не нужны никакие помощники, во-вторых, он будет работать в своей маленькой мастерской. Его дело предлагать эскизы и образцы. Массовое тиражирование может происходить в другом месте, он кустарь.

Tuesday, 12 August 2025

ComfyUI Flow разное.

Привет всем.

А вы еще помните многообещающий проект ComfyUI Flow? Да, тот самый, который решил поместить свое GUI под крыло ComfyUI.

Автор ComfyUI Flow создал новый интерфейс который не должен был пугать новичка родными связями ComfyUI и все это спрятал в новый GUI написанный на Javascript.


Идея оказалась неплохая, но я еще при первом знакомстве сделал вывод что такой проект долго не протянет. Как видите апдейтов после версии 0.5.2 нет уже почти год. И врядли будут..., уж слишком его GUI далек от самой концепции ComfyUI. И пользователю будет тяжело перейти на native ComfyUI.

Однако и из того что есть можно извлечь что-то полезное.

1. Например все интересные воркфлоу ComfyUI Flow находяться здесь:

D:\ComfyUI\custom_nodes\ComfyUI-disty-Flow\web\flows

И если у вас один из них не работает в ComfyUI Flow (увы, такое случается часто), то его как файл ws.json можно загрузить напрямую в ComfyUI и там уже помучать.

2. Mеня также удручало то что в его GUI я не могу править теги для фильтрации. А из коробки мне было мало, да и не все они были в тему. 

Поэтому пришлось нырнуть глубже и поправить файлик main.js. Там есть секция categoryKeywords в которую и стоило поместить нужные мне теги. Регистр имеет значение!

Вот мой последний вариант набора тегов:

Wednesday, 6 August 2025

Порт GUI в GenAI.

Привіт привіт.

Як відомо більшість локальних GenAI генераторів Forge, Foooсus, SXDL2 тощо активують свій веб-сервер  з портом 7860 або іншим вільним на зараз. 

Номер порта при запуску можливо поміняти параметром --port, або  неможливо (непередбачено), і тоді його номер по замовченню треба шукати в python коді сервера.

Якщо ви викорстовуєте декіліька генераторів, як я, то немає потреби запам'ятовувати їх, а вистачить зробити URL лінки на кожен з них.

Але тут є підводний камінь - якщо лінк повністю співпаде по назві, наприклад http://localhost:7860 то його збереження може переписати попередній. Тобто був у вас лінк на Automatic, а став раптом на Forge.)

Плюс є ще такі standalone генератори як OmniGen або WAN2GP тощо, і знову плюс ті самі лінки..., виглядає такий набір важно але.

До чого я веду? 

Можно зробити простіше - тепер я роблю URL тільки на номер порта. І все. А поточний номер порта я завжди бачу в консолі того генератора який зараз використовую. Це набагато економніше по рухах мишкою. Звісно це стосується тих випадків коли GUI генератора не відкривається автоматом.

Щасти.

Saturday, 2 August 2025

Hosting ComfyUI via WebSocket

Hi all.

Today, I will share with you a post by a guru Philipp Doll on using websocket with СomfyUI. I have previously experimented with the API  with ComfyUI.

I can't say how much this might be needed for the regular ComfyUI user, but it's cool that this option is there.

Let us proceed.

Motivation

This article focuses on leveraging ComfyUI beyond its basic workflow capabilities. You have created a fantastic Workflow and want to share it with the world or build an application around it. By hosting your projects and utilizing this WebSocket API concept, you can dynamically process user input to create an incredible style transfer or stunning photo effect.

Introduction

This post describes the basic structure of a WebSocket API that communicates with ComfyUI. Generating images through ComfyUI typically takes several seconds, and depending on the complexity of the workflow,

this time can increase. We utilize a WebSocket connection to track progress and allow us to give real-time feedback to the user. Using these endpoints without a WebSocket connection is possible, but this will cost you the benefits of real-time updates.

Code for a basic WebSocket API structure can be found here: Basic WebSocket API.


Utilized ComfyUI endpoints

ComfyUI already has predefined endpoints ComfyUI endpoints, which we can target. Furthermore, ComfyUI also offers a WebSocket interface. For the API described later in this blog post, we do not need to modify this file, as it already provides everything we need.

@routes.get('/ws')  ⇒ Returns the WebSocket object, sends status and executing messages

@routes.post("/prompt")  ⇒ Queues prompt to workflow, returns prompt_id or error

@routes.get("/history/{prompt_id}")  ⇒ Returns the queue or output for the given prompt_id

@routes.get("/view")  ⇒ Returns an Image given a filename, subfolder, and type ("input", "output", "temp")

@routes.post("/upload/image") ⇒ Uploads an image to ComfyUI, given image_data and type ("input", "output", "temp")


Версия на печать

Популярное