Creative IT practitioner's blog - take your thought and give it idea acceleration!
My IT goals: GenAI, Networks, Security, Virtualization and Multimedia.
Нова версія Pro знаменує собою фундаментальну зміну в архітектурі мого додатку Pixel AI Studio. Продукт еволюціонував від інтерфейсу для генерації зображень (API Wrapper) до повноцінного гібридного графічного редактора.
Ключовою інновацією версії Pro є впровадження Hybrid Processing Pipeline, де можливості генеративного штучного інтелекту (Google Gemini/Imagen/Veo) поєднуються зі складними алгоритмами комп'ютерного зору (Computer Vision), що виконуються безпосередньо у браузері користувача. Це дозволило реалізувати функції, недоступні для звичайних ШІ-генераторів (стереограми, точні схеми, 3D-анімації).
2. КЛЮЧОВІ ІННОВАЦІЇ (ZERO-TO-ONE FEATURES)
У новій версії реалізовано модулі (стилі), яких не існувало в попередніх ітераціях.
Знаєш це відчуття, коли хочеш просто зробити прикольну аватарку або жартівливе фото, а тобі пропонують:
Подивитися 5 рекламних роликів.
Зареєструватися через пошту прабабусі.
Розібратися в налаштуваннях, які виглядають як панель керування шатлом.
Мене це, чесно кажучи, дістало. Я подумав: «Чому не можна просто натиснути кнопку і отримати результат?». І оскільки я програміст, хоча і в минулому, я вирішив не скаржитися в коментарях, а зробити власний веб-застосунок. Для себе. І, звісно ж, для тебе.
Це максимально простий інструмент для заміни обличчя та зміни стилю фото. Я прибрав усе зайве. Тут немає складних меню чи платних підписок, захованих дрібним шрифтом.
Моя філософія проста: технології мають бути доступними абсолютно для всіх. Неважливо, чи ти школяр, SMM-ник, чи просто хочеш надіслати веселу листівку в родинний чат - ти розберешся за 5 секунд.
🔥 ВЕЛИКЕ ОНОВЛЕННЯ: Стилі, які ти полюбиш
Останніми вечорами я працював над тим, щоб додати у додаток "характеру". Я не хотів, щоб це була просто чергова "мінялка облич". Я хотів, щоб ти міг передати настрій.
If you feel overwhelmed by the nodes, you can hide the nodes and connections by using subgraphs. What does a subgraph do? ComfyUI subgraph: Game changer or a nice try?
Вау, програма “Ножиці” (Snipping Tool, “Засіб захоплення фрагментів”), яка працює через комбінацію Win + Shift + R, вже навчилася записувати відео з голосом, але невдовзі буде здатною на більше.
У збірці на каналі для розробників Windows 11 Canary сайт Windows Latest помітив Snipping Tool версії 2022.2507.14.0 з новими можливостями. Програма може автоматично виділити вікно, щоб записати його вміст (раніше так можна було робити лише статичні скриншоти). Microsoft додала функцію вибору вікна для відеозапису, а також текстові та графічні анотації до того, як скриншот буде збережений.
Якось ввечері надивившись відео про SageAttention я вирішив спробувати це чудо інженерної думки в себе на сервері GenAI. Звісно повівся я на те що всі запевняли що інсталювати його не проблема, натомість буду мати вигоду по швидкості генерації в ComfyUI до 30%.
Зважаючи на те що в Stability Matrix в якості бекенду використовується саме ComfyUI (там він зветься як Inference), то чому б не задіяти ШТАТНУ функцію з меню.
Тим більше що автор ось цього відео запевняв глядача що це самий ПРОСТИЙ спосіб отримати SageAttention.
Та не так сталося як гадалося!)
Я витратив годину на те щоб зрозуміти що Matrix це чорна скриня і будь які намагання зовні зробити йому апгрейд будуть проігноровані, і ще три години на те щоб полагодити ComfyUI, який там знаходиться в пакетах і який я так легко поламав намагаючсь додати SageAttention...
Мабуть у автора відео Matrix інший, хоча він також вибирав портабельну установку.
Зрозуміло, що це не просто проблема установки - Matrix у своєму портативному середовищі просто не дозволяє збирати сучасні C++/CUDA пакети на зразок SageAttention. Тобто сенс був спробувати зробити все "з Matrix", але через старі версії setuptools/distutils та обмеження venv це просто не спрацює.
То ж маю кілька висновків:
Matrix обмежений у підтримці нових пакетів, які потребують компіляції.
SageAttention вимагає збірки з torch, і навіть всі обхідні способи які він сам і пропонує (--no-build-isolation, editable, копіювання Node) не працюють у тому venv.
Для роботи безпосередньо в Matrix можна:
чекати, поки SageAttention зроблять prebuilt для Windows + Python 3.10 у портативному вигляді;
або шукати альтернативний Node/Attention, який не потребує збірки (чистий Python).
Тобто, на жаль, сенс “зробити все всередині Matrix” для цієї версії SageAttention тут обмежений технічно.
Все, Matrix більше не чіпаємо!
Але маємо ще декілька гарних варіантів щодо встановлення SageAttention в окремий, все ще портабельний ComfyUI. До речі, вони також згадані в тому відео.
Перший це файлік SageAttention-NEXT.bat з ComfyUI-Easy-Install. Не обов'язково виконувати сам ComfyUI-Easy-Install, просто пирніть глибше в архів папка Add-ons, він там.
Тобто кладете цей файл в свій ComfyUI в підпапку /Add-ons і звідти його виконуєте.