13 мая, 2024

hleb

Находите все последние статьи и смотрите телешоу, репортажи и подкасты, связанные с Россией.

AI Stability выпускает бета-версию SDXL (стабильное развертывание XL)

AI Stability выпускает бета-версию SDXL (стабильное развертывание XL)

Бета-версия последней модели Stability AI, SDXL, теперь доступна для предварительного просмотра (бета-версия Stable Diffusion XL). Они могли бы дать нам больше информации о модели, но любой, кто хочет попробовать ее. Совершенно новая модель под названием SDXL сейчас проходит обучение. Неизвестно, будет ли она называться моделью SDXL, когда она будет опубликована, и она еще далека от завершения. Можно лишь предположить, что это более сложная модель с большим количеством параметров и другими улучшениями. Номер версии — 2, а не 3. Возможно, изменения в модели версии 2 могут увеличить производительность системы, но легче понять, насколько, если знать больше. Также полезно знать, какие параметры были изменены или добавлены в этой версии.

Шаблон SDXL можно найти в DreamStudio, официальном генераторе изображений Stability AI. Он использует передовые алгоритмы и методы глубокого обучения для создания привлекательных изображений, которые хорошо подходят для различных сервисов. Перейдите в раскрывающийся список «Модель» и выберите SDXL Beta, чтобы попробовать.

Модель SDXL: как ею пользоваться

ДримСтудио, официальный производитель изображений Stability AI, теперь предлагает модель SDXL. Доступ к модели SDXL можно получить через меню «Модель»; Выберите бета-версию SDXL.

улучшения

разборчивый текст

Способность SDXL генерировать читаемый текст выделяется еще больше, потому что это было невозможно в предыдущих версиях v1 и v2.1. Как показано в скрипте стабильного распространения ниже, текст, сгенерированный SDXL, только иногда бывает точным. Однако он намного лучше, чем версии 2.1 и 1. Благодаря превосходному алгоритму глубокого обучения SDXL могут понимать и создавать более сложные языковые конструкции. Он может стать более точным и надежным при постоянном развитии.

READ  Amiga A500 Mini будет выпущена с 25 играми в марте 2022 года

Анатомия человека

Преобладание звука всегда мешало созданию анатомически точных моделей человека. Нередко можно увидеть людей с отсутствующими или лишними конечностями. Общие методы исправления включают внутреннее рисование и, в последнее время, возможность копирования позы из эталонного изображения с использованием возможности открытой позы ControlNet. Модель SDXL Beta добилась больших успехов в правильном воссоздании ситуаций по фотографиям и использовалась во многих областях, включая анимацию и виртуальную реальность.

Портретный стиль

SDXL Beta — это улучшение по сравнению с версией 1.5, позволяющее создавать портреты, похожие на фотографии. Более реалистичный и естественный вид изображений достигается благодаря обновленному алгоритму SDXL Beta. Пользователь может настроить уровни резкости и насыщенности для получения индивидуальных результатов.

Дьютон

В версии 1.5 термин «дуотон» всегда создает монохромные изображения. Но теперь SDXL Beta создает двухцветные изображения всех цветов радуги. Улучшенная быстрая интерпретация моделей V2 привела к более точным и релевантным ответам, что сделало его более надежным инструментом для приложений НЛП.

художественные приемы

Были небольшие доработки, но поскольку новая модель отличается, трудно сказать, стали ли результаты лучше или нет. Нелегко судить о качестве этих правок, поскольку это может быть вопросом личного выбора или личного мнения. Однако новый характер изменений может быть интригующим и требует дальнейшего изучения.

Преимущества и результаты

  • Распространение звука теперь может привести к осмысленному тексту.
  • По сравнению с версиями v2.1 и (в меньшей степени) v1.5 изображения, созданные SDXL, намного приятнее для глаз.
  • Новая модель генерирует более точные изображения.
  • прогресс человеческого организма.
  • В отличие от версии 2.1 отрицательные подсказки теперь необязательны.
  • Он может делать реалистичные селфи.
  • Исследователи исправят некоторые недостатки в модели до того, как она будет выпущена.
READ  Сегодня Baldo: The Guardian Owls получает совершенно новое приключение в бесплатном обновлении

Ключевая особенность

  • Используйте txt2img, чтобы превратить письменные объяснения в потрясающие визуальные эффекты.
  • Можно вывести свои изображения на новый уровень, используя img2img.
  • При раскрашивании моделей можно накладывать новые части изображения.
  • Закажите изображения оптом: создайте партию изображений за один раз.
  • Обновление ESRGAN x2Plus: теперь с удвоенным разрешением (попробуйте с img2img).
  • Поддержка диаграмм X, Y и Z, позволяющая визуально сравнивать входные данные и результаты.

детерминанты

  • Возможна несовместимость с другими надстройками. Прежде чем сообщать о проблеме, следует подумать об удалении любых других плагинов.
  • Десять платежей — это максимально допустимое количество.
  • Не все сэмплеры поддерживают маршрутизацию клипов.

в Страница GitHub Подробнее о настройке программы. Вы также можете проверить Справочная статья.

Не забудьте присоединиться 18k+ML Подписка RedditИ Дискорд-каналИ И Информационный бюллетень по электронной почте, где мы делимся последними новостями об исследованиях ИИ, крутыми проектами в области ИИ и многим другим. Если у вас есть какие-либо вопросы относительно статьи выше или если мы что-то пропустили, напишите нам по адресу [email protected]

🚀 Ознакомьтесь с инструментами искусственного интеллекта 100 в клубе инструментов искусственного интеллекта.

Дханшри Шенвай (Dhanshree Shenwai) — инженер по компьютерным наукам с солидным опытом работы в финтех-компаниях, занимающихся финансами, картами, платежами и банковским делом, и проявляет большой интерес к приложениям искусственного интеллекта. Она увлечена изучением новых технологий и разработок в современном развивающемся мире, облегчающим жизнь каждого.

🔥 ОБЯЗАТЕЛЬНО ПРОЧИТАЙТЕ — Что такое ИИ-галлюцинация? Что не так с чат-ботами с искусственным интеллектом? Как обнаружить наличие галлюцинаций искусственного интеллекта?