15 ноября, 2024

hleb

Находите все последние статьи и смотрите телешоу, репортажи и подкасты, связанные с Россией.

Новый поиск AI позволяет вам щелкать и перетаскивать изображения, чтобы управлять ими за считанные секунды.

Новый поиск AI позволяет вам щелкать и перетаскивать изображения, чтобы управлять ими за считанные секунды.

Нет, это еще не конец: возможности инструментов ИИ для обработки изображений продолжают расти. Последний пример пока представляет собой исследовательскую работу, но он очень впечатляет, поскольку позволяет пользователям просто перетаскивать элементы с изображения, чтобы изменить их внешний вид.

На первый взгляд это звучит не очень захватывающе, но взгляните на приведенные ниже примеры, чтобы понять, на что способна эта система.

Вы можете не только изменять размеры автомобиля или превращать улыбку в хмурую с помощью простого нажатия и перетаскивания, но и вращать объект фотографии, как если бы это была 3D-модель, например, изменяя направление взгляда человека. Одна демонстрация показывает, как пользователь регулирует отражения на озере и высоту горного хребта несколькими щелчками мыши.

Вот обзор различных тем:

Вот более пристальный взгляд на обработку ландшафта:

И просто для удовольствия, повозитесь с черным:

Эти видео взяты из Домашняя страница исследовательской группыхотя это может быть нарушено объемом трафика, отправляемого на сайт через Twitter (В основном от user_akhaliq, который отлично справляется с выделением интересных статей об искусственном интеллекте и заслуживает продолжения, если это вас интересует). Вы также можете прочитать статью на arXiv здесь.

Как отметила ответственная команда, самое интересное в этой работе — не обязательно манипуляции с изображениями. В себе, но пользовательский интерфейс. Мы уже давно можем использовать инструменты ИИ, такие как GAN, для создания фотореалистичных изображений, но большинству методов не хватает гибкости и точности. Вы можете попросить генератор изображений ИИ «сделать изображение льва, крадущегося в саванне», и он его получит, но может и не получиться. точно Придумайте то, что вы хотите или в чем нуждаетесь.

Эта модель под названием DragGAN предлагает очевидное решение этой проблемы. Интерфейс точно такой же, как у традиционной деформации изображения, но вместо того, чтобы просто размазывать и пикселизировать существующие пиксели, модель создает тему заново. Как писали исследователи:[O]Ваш подход может привести к галлюцинациям вложенного содержимого, как зубы во рту льва, и оно может деформироваться после того, как объект затвердеет, как сгибание ноги лошади».

READ  Открытие прорыва открывает путь для компьютеров, похожих на мозг

Очевидно, что на данный момент это только демонстрация, и полностью оценить технологию невозможно. (Например, насколько реалистичны окончательные изображения? Трудно сказать, основываясь на доступных видеороликах с низким разрешением.) Но это еще один пример упрощения обработки изображений.