Проект для курса по организации процессов с DS и ML на Stepik.org. Интерфейс браузера на основе библиотеки интерфейсов Gradio для Stable Diffusion. Опирается на решение от пользователя.
Убедитесь, что необходимые зависимости соблюдены, и следуйте инструкциям, доступным для обоих NVidia (рекомендуется) и AMD графические процессоры.
В качестве альтернативы используйте онлайн-сервисы (например, Google Colab):
- Установите Python 3.10.6, отметив «Добавить Python в PATH».
- Установите git.
- Загрузите репозиторий project-1-stable-diff-gradioui, например, запустив
git clone https://github.com/ayranamo/project-1-stable-diff-gradioui.git
. - Поместите
model.ckpt
в каталогmodels
(см. официальная загрузка, файловое хранилище). - (Необязательно) Поместите
GFPGANv1.4.pth
в базовый каталог вместе сwebui.py
(Модели ESRGAN, такие как модели из базы данных моделей , могут быть помещены в каталог ESRGAN. Файл будет загружен как модель, если у него есть .pth расширение, и он будет отображаться под своим именем в пользовательском интерфейсе). - Запустите
webui-user.bat
из проводника Windows как обычный пользователь без прав администратора.
- Установите зависимости:
# Debian-based:
sudo apt install wget git python3 python3-venv
# Red Hat-based:
sudo dnf install wget git python3
# Arch-based:
sudo pacman -S wget git python3
- Чтобы установить в
/home/$(whoami)/project-1-stable-diff-gradioui/
, запустите:
bash <(wget -qO- https://raw.githubusercontent.com/ayranamo/project-1-stable-diff-gradioui/master/webui.sh)
- Если Homebrew не установлен, следуйте инструкциям на странице https://brew.sh, чтобы установить его. Держите окно терминала открытым и следуйте инструкциям в разделе «Следующие шаги», чтобы добавить Homebrew в PATH.
- Откройте новое окно терминала и запустите
brew install cmake protobuf rust [email protected] git wget
. - Клонируйте репозиторий веб-интерфейса, запустив git clone
git clone https://github.com/ayranamo/project-1-stable-diff-gradioui.git
. - Скопируйте любые модели Stable Diffusion, которые вы хотите использовать, в файл project-1-stable-diff-gradioui/models/Stable-diffusion.
- cd
project-1-stable-diff-gradioui
, а затем./webui.sh
для запуска веб-интерфейса. Виртуальная среда Python будет создана и активирована с помощью venv, а все оставшиеся недостающие зависимости будут автоматически загружены и установлены. - Чтобы перезапустить процесс веб-интерфейса позже, снова запустите
./webui.sh
.
- Автору проекта — https://github.com/AUTOMATIC1111/
- Stable Diffusion - https://github.com/CompVis/stable-diffusion, https://github.com/CompVis/taming-transformers
- k-diffusion - https://github.com/crowsonkb/k-diffusion.git
- GFPGAN - https://github.com/TencentARC/GFPGAN.git
- CodeFormer - https://github.com/sczhou/CodeFormer
- ESRGAN - https://github.com/xinntao/ESRGAN
- SwinIR - https://github.com/JingyunLiang/SwinIR
- Swin2SR - https://github.com/mv-lab/swin2sr
- LDSR - https://github.com/Hafiidz/latent-diffusion
- MiDaS - https://github.com/isl-org/MiDaS
- Идеи для оптимизации - https://github.com/basujindal/stable-diffusion — Оптимизация уровня перекрестного внимания — Doggettx — https://github.com/Doggettx/stable-diffusion, оригинальная идея для оперативного редактирования.
- Оптимизация уровня перекрестного внимания - InvokeAI, lstein - https://github.com/invoke-ai/InvokeAI (первоначально http://github.com/lstein/stable-diffusion)
- Textual Inversion - Rinon Gal - https:// github.com/rinongal/textual_inversion (мы не используем его код, но используем его идеи).
- Идея для апскейла SD - https://github.com/jquesnelle/txt2imghd
- Генерация шума для перекрашивания mk2 - https://github.com/parlance-zz/g-diffuser-bot
- Идея опросчика CLIP и заимствование некоторого кода - https://github.com/pharmapsychotic/clip-interrogator — Идея для компонуемой диффузии — https://github.com/energy-based-model/Compositional-Visual-Generation-with-Composable-Diffusion-Models-PyTorch — xformers - https://github.com/facebookresearch/xformers
- DeepDanbooru - опросчик для аниме-диффузоров https://github.com/KichangKim/DeepDanbooru
- Совет по безопасности - RyotaK
- Initial Gradio script - размещен на 4chan анонимным пользователем.