Продвинутый генератор видео Google Veo 3. Тест Photar.ru

ИИ-система генерации видео Google Veo 3 стала бесплатной до конца текущих выходных (до 25 августа). Сервис доступен через фирменного помощника Gemini. Чтобы воспользоваться одной из самых мощных нейронок для видео может потребоваться VPN, а также учетная запись Google. Сервис дает сделать 3 бесплатных генерации с одного аккаунта.

Вы могли видеть в сети ролики с опросами на улицах, подкасты с котиками, персонажами кино и животными, которые ведут виидеоблоги — именно в Veo 3 создаются данные материалы.

Photar.ru решил тоже потестировать сервис. Для начала дадим запрос попроще: «Создай видео как рыжий котик сидит краю скалы на закате и зевает, на заднем плане виднеется море»:

Стоит сразу оговориться, что на данный момент результат не удастся получить, если попытаться генерировать видео из своих фотографий или же попытаться «оживить фото».

Кстати вот и результат полученный по первому запросу:

Далее попробуем сцену посложнее.

Описание: «сцена — человек держит в руках камеру Sony FX-2 и обозревает ее, произнося следующую фразу «как вы можете заметить видоискатель здесь несъемный» (в этот момент происходит демонстрация видоискателя камеры — ведущий разворачивает камеру видоискателем к нам) и далее продолжает «а экранчик несколько хуже чем у Sony FX-3″. Тембр голоса ведущего должен быть приятным и видео максимально реалистично выглядеть — как обычный обзор на камеру»

Интересно, что на роль ведущего по умолчанию была выбрана девушка.

В целом задача выполнена, однако со звуком не все так гладко. А также наше не совсем корректное написание модели камеры в результате привело к аналогичному допущению в финальном ролике.

Все же решили уточнить — получится ли сгенерировать видео из своих фото ?

Однако! Посмотрим, что же сгенерировалось:

Теперь попробуем очень мощный и точный промт (возможно, нейросеть к такому не готова!):

«Создай видеоролик, демонстрирующий человека, умело катающегося на скейтборде в городских условиях. Камера динамично меняет ракурсы, снимая райдера сбоку, сзади и парящего в воздухе, чтобы погрузить зрителей в действие. Под энергичную рок-музыку скейтбордист исполняет впечатляющий прыжок. В этот кульминационный момент видео резко замедляется с частотой 240 кадров в секунду, подчеркивая каждую деталь движения. Одновременно с этим камера плавно вращается вокруг райдера, подчёркивая плавность и мастерство исполнения трюка. Плавное сочетание движения и музыки создаёт захватывающий кинематографический».

Как итог видим ошибку, пробуем повторно результат тот же.

Ну что ж, попробуем перефразировать попроще:

«Создай видео как человек катается на скейте, кадры должны быть динамичные и сменяются сбоку-сзади-сверху, при этом играет фоновая музыка рок. Человек делает трюк прыжок на скейте и в этот момент нужно замедление в 240 кадров в секунду и круговой поворот камеры вокруг человека при выполнении трюка».

Что-то в таком духе и получаем. Единственное, насчет поворота камеры вокруг объекта, ИИ не совсем понял задачу.

Как видим, пока что на профессионализм данный инструментарий не претендует (уже имеются и аналоги, например Vadoo, но в РФ недоступны). Возможно с PRO подпиской доступно больше функций, как минимум нужны кредиты для корреляции и улучшения запросов.