Новый поиск AI позволяет вам щелкать и перетаскивать изображения, чтобы управлять ими за считанные секунды.

Нет, это еще не конец: возможности инструментов ИИ для обработки изображений продолжают расти. Последний пример пока представляет собой исследовательскую работу, но он очень впечатляет, поскольку позволяет пользователям просто перетаскивать элементы с изображения, чтобы изменить их внешний вид.

На первый взгляд это звучит не очень захватывающе, но взгляните на приведенные ниже примеры, чтобы понять, на что способна эта система.

Вы можете не только изменять размеры автомобиля или превращать улыбку в хмурую с помощью простого нажатия и перетаскивания, но и вращать объект фотографии, как если бы это была 3D-модель, например, изменяя направление взгляда человека. Одна демонстрация показывает, как пользователь регулирует отражения на озере и высоту горного хребта несколькими щелчками мыши.

Вот обзор различных тем:

Вот более пристальный взгляд на обработку ландшафта:

И просто для удовольствия, повозитесь с черным:

Эти видео взяты из Домашняя страница исследовательской группыхотя это может быть нарушено объемом трафика, отправляемого на сайт через Twitter (В основном от user_akhaliq, который отлично справляется с выделением интересных статей об искусственном интеллекте и заслуживает продолжения, если это вас интересует). Вы также можете прочитать статью на arXiv здесь.

Как отметила ответственная команда, самое интересное в этой работе — не обязательно манипуляции с изображениями. В себе, но пользовательский интерфейс. Мы уже давно можем использовать инструменты ИИ, такие как GAN, для создания фотореалистичных изображений, но большинству методов не хватает гибкости и точности. Вы можете попросить генератор изображений ИИ «сделать изображение льва, крадущегося в саванне», и он его получит, но может и не получиться. точно Придумайте то, что вы хотите или в чем нуждаетесь.

Эта модель под названием DragGAN предлагает очевидное решение этой проблемы. Интерфейс точно такой же, как у традиционной деформации изображения, но вместо того, чтобы просто размазывать и пикселизировать существующие пиксели, модель создает тему заново. Как писали исследователи:[O]Ваш подход может привести к галлюцинациям вложенного содержимого, как зубы во рту льва, и оно может деформироваться после того, как объект затвердеет, как сгибание ноги лошади».

Очевидно, что на данный момент это только демонстрация, и полностью оценить технологию невозможно. (Например, насколько реалистичны окончательные изображения? Трудно сказать, основываясь на доступных видеороликах с низким разрешением.) Но это еще один пример упрощения обработки изображений.

Anton Kuzmin

«Zombie amateur evangelist. Incurable creator. Proud twitter innovator. Food lover. Internetaholic. Rigid introvert.»

Новый поиск AI позволяет вам щелкать и перетаскивать изображения, чтобы управлять ими за считанные секунды.

Spotify обвиняет Apple в нежелательном изменении технологии регулировки громкости

Первый пациент Neuralink дал имя своему мозговому чипу и выучил новые языки

Meta рассматривает возможность выпуска новых очков смешанной реальности в качестве альтернативы гарнитурам

Опрос показал, что 76% украинцев считают всех россиян ответственными за вторжение

Германия ужесточает законы об оружии и правила предоставления убежища после инцидента с ножевым ранением в Золингене | Германия

Ирландский инвестор закрывает сделку на сумму 35 миллионов евро по покупке офиса Meta в районе Доклендс в Дублине.

Дата переиздания фильма принца Гарри «Запасной» вызвала споры

Добавить комментарий Отменить ответ

More Stories