Всем привет.
Сегодня я хочу рассказать вам о VisoMaster - проекте, который делает замену лиц в видео и изображениях проще и доступнее для всех. Это open-source решение, которое работает на Windows и Linux и подходит как для творческих экспериментов, так и для знакомства с технологиями deepfake. Хотите попробовать себя в роли видеомонтажёра или узнать, как работают нейросети? Давайте разберём, что это за инструмент, чем он примечателен и как его установить.
Что такое VisoMaster?
VisoMaster - это проект на GitHub (https://github.com/visomaster/VisoMaster), созданный энтузиастами, включая @argenspin и @Alucard24. Он позволяет загружать видео или фото, выбирать любое лицо для замены и получать результат с помощью нейросетей. Всё интуитивно: добавляете материалы, настраиваете параметры, запускаете обработку. Проект поддерживает разные форматы файлов, а в последних обновлениях (v0.1.5) появилась возможность передавать результат на виртуальную камеру - например, для стримов в OBS.
VisoMaster вырос из популярного редактора Rope и его ответвления RopeMod. Оригинальный Rope давно не обновлялся - разработчик не выпускал новых версий уже наверное более полугода. Сообщество решило взять дело в свои руки и создало своего рода "переосмысление" проекта. VisoMaster унаследовал ключевые возможности RopeMod, такие как детальная настройка масок и поддержка видео с веб-камеры, но при этом стал быстрее и удобнее. Интерфейс теперь отзывчивее, можно работать не только с папками, но и с отдельными файлами, а некоторые инструменты заметно ускорились.
Для чего нужен VisoMaster.
VisoMaster открывает простор для творчества. С ним можно создавать забавные ролики с заменой лиц, делать уникальные аватарки или экспериментировать с видео. Стримеры оценят интеграцию с виртуальной камерой - представьте, как ведёте эфир с другим лицом в реальном времени. А для тех, кто только начинает знакомство с нейросетями, это удобный способ увидеть их работу без глубокого погружения в технические детали.
Как установить VisoMaster.
Установка зависит от вашей системы. Для Windows есть простой автоматический вариант, а для Linux или желающих настроить всё вручную - более гибкий подход.
Как установить VisoMaster для Windows:
1. Перейдите на страницу релизов VisoMaster (https://github.com/visomaster/VisoMaster/releases) и скачайте последнюю версию программы на февраль 2025 года - v0.1.5. Для этой версии доступна портативная версия в формате архива (.zip). Скачайте файл, но обратите внимание: портативная версия не содержит встроенного выбора версии CUDA. Убедитесь, что на вашем компьютере уже установлена совместимая версия CUDA, соответствующая вашей видеокарте NVIDIA:
- для видеокарт серии 10xx (например, GTX 1080) используйте CUDA 11.8.
- для видеокарт серии 20xx и выше (например, RTX 2080 или новее) используйте CUDA 12.4.
Проверьте, что у вас установлены актуальные драйверы NVIDIA, совместимые с выбранной версией CUDA (информацию о минимальных версиях драйверов можно найти в документации CUDA или на сайте NVIDIA).
Распакуйте скачанный архив в удобное место на вашем компьютере - например, в папку на диске C или D. Для этого используйте любой архиватор 7-Zip или встроенные средства Windows.
После распаковки откройте папку с программой и найдите файл Start_Portable.bat. Дважды щёлкните по нему, чтобы запустить VisoMaster. В процессе запуска скачаются необходимые для работы зависимости и модели. Интерфейс программы откроется, и вы сможете приступить к работе.
Примечание 1: портативная версия не требует установки и автоматически использует уже установленную версию CUDA. Если возникают ошибки, связанные с CUDA (например, несовместимость версий), проверьте, что ваша видеокарта и драйверы поддерживают выбранную версию CUDA, и обновите их при необходимости. В принципе должен присутствовать файл install.dat где указана ваша версия CUDA, например cu124:
Примечание 2: портативная версия также предполагает что у вас уже установлены Python и Git. Увы, у меня такого нет, так как на моем сервере все что для GenAI портабельное, поэтому я, не долго думая, решил начать с п.2.
2. Упрощённый вариант для ленивых (сегодня это буду я):
если вы не уверены, как установить или проверить правильную версию CUDA для портативной версии, вы можете использовать более раннюю версию VisoMaster - v0.1.1, где доступен установочный файл (exe).
Перейдите на страницу релизов (https://github.com/visomaster/VisoMaster/releases), крутаните страницу вниз и найдите версию v0.1.1 и скачайте установочный файл формата ЕХЕ.
Запустите его, и следуйте инструкциям и в процессе установки, выберите подходящую версию CUDA для вашей видеокарты:
- CUDA 11.8 для видеокарт серии 10xx (например GTX 1080).
- CUDA 12.4 для видеокарт серии 20xx и выше (RTX 2080 или новее).
Я проверил - скорее всего, это единственный выбор по ходу установки. Причем выбор или отмена установки моделей и зависимостей все равно заканчиваются их обязательной установкой.
После установки откройте папку с программой, найдите файл Update_Portable.bat и запустите его, чтобы обновить проект до актуальной версии (v0.1.5 на март 2025 года). Тут процесс долгий ибо будут закачиваться все модели для работы. Затем найдите файл Start_Portable.bat и, та даааам, запустите саму программу.
3. Для продвинутых пользователей Windows/Linux:
Хотите собрать VisoMaster самостоятельно или установить на Linux?
Все шаги подробно описаны в README на странице проекта (https://github.com/visomaster/VisoMaster). Там есть инструкции по работе с Git, Miniconda, Python 3.10.13 и нужными библиотеками. Это требует больше времени и знаний, но позволяет гибко настроить программу под себя. Можете заглянуть на youtube, там полно видеоинструкций.
Если что-то не запускается - например, из-за CUDA или отсутствия моделей, - обновите драйверы GPU и проверьте, всё ли зависимости установлены корректно. Для Windows автоматический установщик (ехе-файл) обычно решает большинство вопросов. Но если вам не жаль своего времени, то...
Теперь о самом интерфейсе и работе с ним. Для тех, кто не знаком с ним и не понимает, что означают все эти параметры и значения, я могу облегчить вам задачу. Чтобы вы не тратили время на эксперименты и не искали решение методом проб и ошибок, по этой ссылке предоставлено описание функций и возможностей каждого пункта меню несущего в себе полезную смысловую нагрузку.
Но судя по длинному списку, быстрее вы осилите эту програмулину именно методом проб.
PS: есть в мире GenAI такой парень Neurogen, который лихо портирует проекты с huggingface, и мне кажется что и VisoMaster тоже его творение, пусть и не индивидуальное. Также как и Mukham, LivePortrait и InstantID. Возможно для Rope понадобилось новое название, вот и поглядим.
Удачи.
No comments:
Post a Comment
А что вы думаете по этому поводу?