Команда Qwen AI компании Alibaba представила продвинутый ИИ-инструмент Qwen-Image-Edit, предназначенный для редактирования фотографий. Он позволяет добавлять, удалять и изменять области изображения, сохраняя при этом другие его части нетронутыми. Помимо этого, Qwen-Image-Edit умеет поворачивать объекты в кадре, переносить стили между изображениями и работать с текстом. Он позволяет добавлять, удалять или изменять текст, сохраняя при этом исходный шрифт, размер и стиль. Photar.ru протестировал новую нейронку.
Разработчики заявляют, что новый инструмент способен справляться с непростыми задачами, используя текстовые запросы любой сложности.
Предполагается, что он работает с различными типами изображений – от рисунков до фотографий – сохраняя при этом их первоначальный смысл. Недавно Qwen-Image-Edit получил обновление, улучшающее качество, стабильность и поддержку различных соотношений сторон.

Команда разработчиков утверждает, что инструмент может удалять даже тонкие волоски или другие мелкие объекты, не изменяя при этом остальную часть изображения. Это похоже на функции «Штамп» или «Восстанавливающая кисть» в Adobe Photoshop. Компания опубликовала пример подобной обработки фотографии нейросетью:

Доступность и первые впечатления
Qwen-Image-Edit доступен для тестирования в чате Alibaba Qwen, который является конкурентом ChatGPT. Пользователи могут загружать свои изображения или выбирать из предложенных примеров.

Инструмент предлагает небольшое количество бесплатных попыток, после чего требуется платная подписка. Исходный код приложения располагается в открытом доступе, что позволяет компаниям развертывать ее на собственных серверах. Система также доступна через Alibaba Cloud Model Studio по цене 0.045 долларов (3 рубля) за изображение.
Одна из предлагаемых функций — восстановление черно-белого фото. То есть создание цветного изображения по чб-фотографии.


Помимо нее заявлены функции изменения одежды или положения объекта на фото (фронтально/в профиле/сзади).


Ещё одно типичное применение семантического редактирования — перенос стиля. Например, имея в наличии портрет, Qwen-Image-Edit может легко преобразовать его в различные художественные стили, например, в стиле Studio Ghibli. Таким способом можно сделать аватар для соцсетей (пример ниже):

Попробуем дать немного смысловой нагрузки для фотографии с камерой «добавь профессиональных аксессуаров для камеры, чтобы можно было на нее снимать кино«:

Видим не очень впечатляющие результаты, однако инструмент ИИ в целом понял задачу.
Также попробуем ключевую функцию — изменение положения объекта съемки. Напишем следующие запросы:



Вполне неплохо получилось, стоит отметить что инструмент подправил композицию кадра (лапки кота были обрезаны снизу), однако изображение, несмотря на сильную схожесть, все же менее детализированное и реалистичное, более «гладкое».
Попробуем тот же запрос с человеком, но немного усложним (ИИ изначально не знает лица):



Естественно, с лицом и в целом с телосложением ИИ прогадал, но общую сцену передал верно. И тут также наблюдаем более «сглаженную» и менее реалистичную картинку.
Выводы
Таким образом, хотя Qwen-Image-Edit способен создавать вполне приемлемые результаты, он также может выдавать и непригодные для использования изображения. На данный момент, несмотря на многообещающие заявления, такие инструменты, как Adobe Photoshop, остаются более надежным выбором.