Маск: c помощью Grok можно будет генерировать полнометражные фильмы

Компания xAI Илона Маска планирует до конца 2026 года расширить возможности нейросети Grok. ИИ сможет генерировать «смотрибельные» полнометражные картины. Бизнесмен уверяет, что «по-настоящему хорошие фильмы» можно будет генерировать в 2027 году.

Маск заявил об этом в комментарии под постом, опубликованном командой xAI. К нему прикреплен ИИ-трейлер к «Одиссее» Гомера, который был создан с помощью модели Grok Imagine Video 1.5.

Трейлер опубликован в 4К и содержит отрывки из сцен, а также демонстрацию функционала нейросети.

Судя по нему, пользователь может прописывать не только сцены, но и детальные диалоги, монологи с указанием требуемых эмоций и других нюансов. Выглядят подобные промты вот так:

Также Grok понимает в деталях кинематографические техники, которые описывает пользователь.

По качеству самого изображения, конечно же, есть вопросы. Некоторые сцены за счет агрессивной стилизации выглядят более-менее натурально, другие же похожи на мультфильм. И однородности между ними нет.

По всей видимости, этот и другие моменты компания xAI рассчитывает поправить к 2027 году, о чем заявляет Маск. Однако, очевидно, работы тут еще много.

Да и сама идея создания кино исключительно с помощью нейросети пока натыкается на несколько существенных нюансов. И главный из них — это неприятие и даже усталость общества от нейроконтента.

Из-за того, что каждый теперь может генерировать картинки и видео — их стало слишком много. И 95% из них бессмысленны. Но эта проблема преодолима: пройдет время и общество может начать привыкать к тому, что полноценное ИИ-кино может быть качественным.

Речь идет о по-настоящему талантливых картинах, в которых работа над сценарием, концепцией, промтами и другими нюансами может оказаться гораздо трудозатратнее, чем традиционная полноценная съемка.

Сейчас ИИ-компании делают смелые шаги для развития подобных технологий.

Если же посмотреть еще шире — подобные ИИ-генераторы дадут возможность независимым режиссерам и сценаристам создавать при минимальном бюджете свои короткие метры и тренироваться без необходимости оплачивать смену команде.

У подобных систем есть большой потенциал в обучении: монтажу, постановке кадра, композиции и другим приемам.

Именно это и демонстрирует представленный ролик компании xAI. Он длится более двух минут и состоит из 36 сцен, стилизованных под голливудское кино 1970-х годов.

Основная техническая же проблема генерации полноценных длинных сюжетов — нейросети зачастую не могут повторить визуал одного и того же персонажа в точности, поскольку перегенерируют его заново в каждом дубле.

Однако ряд нейронок пытают преодолеть это ограничение. Например, Higgsfield использует многокомпонентный связанный промт, который позволяет пользователю менять ракурс в одной сцене с сохранением идентичности экстерьера и дизайна персонажей.

В демонстрации нейро-трейлера от Grok аналогов этой системы показано не было. Зато показано, что вы можете приложить референсы для создания персонажей.

В целом ролик демонстрирует сгенерированные батальные сцены, крупные планы персонажей и кинематографическую композицию кадров, включая попытку имитации пленочной эстетики и классического монтажа.

По словам создателей, трейлер был полностью сгенерирован нейросетью без традиционной съемки. Маск прокомментировал демонстрацию короткой фразой о том, что полноценные фильмы появятся уже к концу года.

Ранее бизнесмен сообщал, что «по-настоящему хорошие фильмы», созданные при помощи Grok, появятся в 2027 году. Что именно подразумевается под «хорошим кино» — пока не совсем понятно.

Grok Imagine Video 1.5

Генерация работает на видеомодели Grok Imagine Video 1.5. Она была представлена в конце мая 2026 года и предназначена для генерации видео из картинки и считается достаточно мощной.

Ключевые возможности Grok Imagine Video 1.5:

  • Генерация видеороликов длительностью до 15 секунд
  • Встроенная генерация звука, атмосферы и речи одновременно с видео
  • Улучшенная синхронизация губ и речи
  • Более реалистичная физика движения объектов
  • Значительно более высокая скорость генерации по сравнению с версией 1.0
  • Поддержка расширения и редактирования видеоклипов

Ее следующее обновление пока не заявлено. Однако можно ожидать, что «по-настоящему хорошее кино» будет создаваться на версия 2.0 или старше.

Конкуренты Grok Imagine Video 1.5 — сильные с точки зрения качества генерации видео модели: Seedance 2.0, Google Veo 3.1, Kling 3.0 (cпособен генерировать длинные сцены), а также Runway Gen-4.5.

Вероятно, в дальнейшем рынок профессионального ИИ-контента поделится на модели, которые будут специализироваться на генерации узкопрофильных сцен: диалогов, заявочных планов, драк и перестрелок, массовых сцен и так далее.

Это неформальное разделение есть уже сейчас. Все выше перечисленные модели имеют свои плюсы и минусы.