AUTOMATIC1111 Веб-интерфейс стабильной диффузии
![]() | |
Оригинальный автор(ы) | АВТОМАТИЧЕСКИЙ1111 |
---|---|
Разработчик(и) | АВТОМАТИЧЕСКИЙ1111 и сообщество |
Первоначальный выпуск | 22 августа 2022 г [ 1 ] |
Репозиторий | github |
Написано в | Питон |
Лицензия | АГПЛ-3.0 [ 2 ] |
АВТОМАТИЧЕСКИЙ1111 Веб-интерфейс стабильного распространения ( SD WebUI , A1111 или автоматический1111) [ 3 ] ) — это с открытым исходным кодом генеративная программа искусственного интеллекта , которая позволяет пользователям генерировать изображения из текстовой подсказки . [ 4 ] Он использует Stable Diffusion в качестве базовой модели для своих возможностей обработки изображений вместе с большим набором расширений и функций для настройки вывода. [ 5 ]
История
[ редактировать ]SD WebUI был выпущен на GitHub 22 августа 2022 г. пользователем AUTOMATIC1111. [ 1 ] Спустя 1 месяц после первого выпуска Stable Diffusion. [ 6 ] В то время Stable Diffusion можно было запустить только через командную строку . [ 5 ] SD WebUI быстро стал популярным и был описан как «самый популярный инструмент для локального запуска диффузионных моделей». [ 4 ] [ 7 ] Исследование шести пользователей StableDiffusion показало, что все участники хотя бы один раз использовали SD WebUI. [ 3 ] Исследование показало, что пользователи объясняют популярность SD WebUI простотой установки и поддержкой инструментов с открытым исходным кодом. [ 3 ] опубликовала книгу В феврале 2024 года ja:Gijutsu Hyoronsha об использовании Stable Diffusion с SD WebUI на японском языке. [ 8 ] [ 9 ] По состоянию на июль 2024 года у проекта было 136 000 звезд на GitHub. [ 10 ]
Функции
[ редактировать ]SD WebUI использует Gradio в качестве пользовательского интерфейса. [ 11 ] [ 12 ] [ 13 ] Каждый параметр в программе Stable Diffusion предоставляется через интерфейс пользовательского интерфейса SD WebUI . SD WebUI содержит дополнительные параметры, не включенные в сам Stable Diffusion, такие как поддержка низкоранговых адаптаций , ControlNet и пользовательских вариационных автоэнкодеров . [ 11 ] [ 12 ] [ 14 ] SD WebUI поддерживает быстрое взвешивание, генерацию изображений на основе изображений, закрашивание , закрашивание и масштабирование изображений . [ 15 ] Он поддерживает более 20 сэмплеров, включая DDIM, Euler, Euler a, DPM++ 2M Karras и UniPC. [ 15 ] [ 16 ] Он также используется для различных оптимизаций по сравнению с базовой Stable Diffusion. [ 5 ]
Стабильная Diffusion WebUI Forge
[ редактировать ]Stable Diffusion WebUI Forge ( Forge ) — заметный форк SD WebUI, созданный Львмином Чжаном, который также является создателем ControlNet и Fooocus . [ 17 ] [ 18 ] Первоначальной целью Forge было улучшение производительности и функций SD WebUI с намерением перенести изменения обратно в SD WebUI. [ 17 ] [ 18 ] Одна из Forge оптимизаций позволила пользователям с низким объемом видеопамяти создавать изображения быстрее в некоторых версиях Stable Diffusion. [ 17 ] Это улучшило скорость генерации для пользователей с 8 ГБ и 6 ГБ видеопамяти на 30–45% и 60–75% соответственно. [ 17 ] [ 18 ] Forge также включает дополнительные функции, такие как поддержка большего количества сэмплеров, чем стандартный SD WebUI. [ 19 ] Некоторые оптимизации Forge были позаимствованы у ComfyUI , а другие разработаны командой Forge. [ 18 ] В августе 2024 года Forge добавила поддержку модели диффузии Flux, разработанной Black Forest Labs, которая еще не поддерживается SD WebUI. [ 20 ]
Ссылки
[ редактировать ]- ^ Перейти обратно: а б АВТОМАТ1111 (22 августа 2022 г.). «Первоначальная фиксация» . гитхаб .
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ АВТОМАТИЧЕСКИЙ1111 (15 января 2023 г.). «добавить файл лицензии» . гитхаб . Проверено 11 июля 2024 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Перейти обратно: а б с Брейд, Стивен; Ван, Брайан; Соуза, Маурисио; Ооре, Сагеев; Гроссман, Тови (29 октября 2023 г.). «Promptify: генерация текста в изображение посредством интерактивного исследования подсказок с помощью больших языковых моделей» . Материалы 36-го ежегодного симпозиума ACM по программному обеспечению и технологиям пользовательского интерфейса . Ассоциация вычислительной техники. стр. 1–14. arXiv : 2304.09337 . дои : 10.1145/3586183.3606725 . ISBN 979-8-4007-0132-0 .
- ^ Перейти обратно: а б Манн, Тобиас (29 июня 2024 г.). «Дружественное руководство по локальной генерации изображений ИИ с помощью Stable Diffusion и Auto1111» . Регистр .
- ^ Перейти обратно: а б с Льюис, Ник (16 сентября 2022 г.). «Как запустить Stable Diffusion локально с графическим интерфейсом в Windows» . Как компьютерщик . Проверено 11 июля 2024 г.
- ^ «Анонсируем SDXL 1.0» . Стабильность ИИ . 26 июля 2023 г.
- ^ Чжу, Эндрю (2024). Использование Stable Diffusion с Python. Используйте Python для управления и автоматизации создания высококачественных изображений AI с помощью Stable Diffusion . Пакт Паблишинг. ISBN 1835084311 .
Веб-интерфейс Stable Diffusion от AUTO MATIC1111: возможно, это самое популярное веб-приложение в настоящее время, которое позволяет пользователям создавать изображения и текст с помощью Stable Diffusion. Он предоставляет графический интерфейс, который позволяет легко экспериментировать с различными настройками и параметрами.
- ^ Осаки, Кен; Мизугути, Эйсуке (23 марта 2024 г.). Руководство по созданию изображений Stable Diffusion, которое могут сделать даже новички на японском языке : Gijutsu Hyoronsha ) . ( 978-4-297-14083-0 .
- ^ Аваширо Икуя (12 июня 2024 г.). № 817: Запустите Stable Diffusion WebUI в Ubuntu со справочником в руках и сгенерируйте изображения» ja : . Gijutsu Hyoronsha «
- ^ АВТОМАТ1111 (август 2022 г.). «Стабильный веб-интерфейс Diffusion» . гитхаб .
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Перейти обратно: а б Ван, Чэнхао; Чанг, Жанхун (30 июня 2023 г.). «Исследование технологии создания ИИ-картин на основе [стабильной диффузии]» . Международный журнал передовой интеллектуальной конвергенции . 12 (2): 90–95. дои : 10.7236/IJASC.2023.12.2.90 .
Stable Diffusion Web UI — это интерфейс браузера, основанный на библиотеке Gradio.
- ^ Перейти обратно: а б Ким, Сонук; Ко, Тэён; Квон, Юсан; Ли, Кёнхо (9 октября 2023 г.). «Проектирование интерфейсов для быстрого преобразования текста в изображение с использованием моделей стабильного распространения: подход взаимодействия человека и искусственного интеллекта» . Серия конференций IASDR . дои : 10.21606/iasdr.2023.448 . ISBN 978-1-912294-59-6 .
- ^ Крюк, Стив (10 января 2024 г.). «Stable Diffusion WebUI — запускайте SDXL локально с помощью графического интерфейса AUTOMATIC1111» . Руководство для ПК .
- ^ Покок, Кевин (16 августа 2023 г.). «Стабильная диффузия: как использовать VAE» . Руководство для ПК . Проверено 11 июля 2024 г.
- ^ Перейти обратно: а б Феникс, Джеймс; Тейлор, Майк (2024). «Веб-интерфейс пользователя AUTOMATIC1111». Оперативная разработка генеративного ИИ: перспективные входные данные для надежных результатов ИИ в больших масштабах (первое издание). Пекин Бостон: О'Рейли. ISBN 109815343X .
- ^ Чжан, Цзин; Цзян, Ян (июнь 2023 г.). «Технология переноса стиля узора батика на основе глубокого обучения». Журнал волоконной биоинженерии и информатики . 16 (1): 57–67. дои : 10.3993/jfbim02171 .
- ^ Перейти обратно: а б с д Кадзухиса Нисикава (14 февраля 2024 г.). «[Нерегулярная колонка Кадзухиса Нисикавы] Для тех, кто отказался от искусственного интеллекта для генерации изображений из-за графического процессора с низким объемом видеопамяти. «Stable Diffusion WebUI Forge» теперь доступен! « . PC Watch (на японском языке).
- ^ Перейти обратно: а б с д Шин Сейши (26 февраля 2024 г.). ИИ создает изображения быстрее даже на дешевых ПК с шокирующим «Stable Diffusion WebUI Forge» (1/4) . » «
- ^ Хорси, Джулиан (14 февраля 2024 г.). «Stable Diffusion WebUI Forge до 75% быстрее, чем автоматический 1111 и ComfyUI» . Гиковские гаджеты .
- ^ Казухиро Тагучи (18 августа 2024 г.) «Запуск популярного искусственного интеллекта «FLUX.1» с помощью «WebUI Forge» для Stable Diffusion (я также пытался ускорить его) (1/6 . ) » ).