Новый ИИ Google Gemini 3 Pro для создателей контента

Новая ИИ-модель Google Gemini 3 Pro получила ряд продвинутых возможностей в фото и видео. Она позволяет преобразовывать статичные изображения в видео (с помощью движка Veo 3) в разрешении 720р, а также «понимает» загруженные фотографии: распознает текст, сцену, объекты и т.д.

Для начала детально разберем фото и видеовозможности новой нейронки.

  • Для фото: Загрузите снимок (от сложной архитектурной схемы до семейного фото). Модель не только опишет, что на нем изображено, но и ответит на уточняющие вопросы: «Каков исторический стиль этого здания?», «Предложи идею для поста в соцсетях на основе этой фотографии» или «Составь список ингредиентов, которые видны на этой полке».

Для видео: Новый ИИ способен «отсмотреть» часовую лекцию, спортивный матч или видеоблог. Она не просто расшифрует речь, но и выделит ключевые моменты, проанализирует действия и сгенерирует структурированный конспект. Например, после анализа футбольного матча он может составить план тренировок, указав на слабые места в обороне команды.

В чем особенности Google Gemini 3 Pro?

Модель не просто распознает объекты на изображении или в видео, а интерпретирует их смысл и взаимосвязи.

Вместо простых фильтров модель предлагает семантическое редактирование, изменяя саму суть изображения.

Нейросеть может изменить освещение на фото с «пасмурного» на «золотой час», убрать нежелательные отражения с витрины или стекла, а также работать со сложными эффектами вроде градиентов и теней, придавая снимку совершенно новое настроение.

С контекстным окном в 1 миллион токенов модель работает с невероятно большими объемами данных. Это позволяет:

  • Обработать десятки старых семейных фото и рукописных рецептов, чтобы автоматически создать и оформить уникальную семейную кулинарную книгу.
  • Загрузить целый учебный курс из видеолекций и PDF-пособий и получить от модели готовые учебные материалы: презентации, карточки для запоминания и сжатые конспекты.

По сути, Gemini 3 Pro становится вашим личным креативным дизайнером, видео-редактором и аналитиком, способным понять ваш замысел и воплотить его в жизнь через фото и видео.

Контекст релиза Google Gemini 3 Pro

Руководство Google сообщает, что двумя ключевыми драйверами роста компани стали поиск с ИИ, которым ежемесячно пользуются 2 миллиарда человек, и приложение Gemini, достигшее аудитории в 650 миллионов пользователей. Более 70% клиентов Google Cloud используют искусственный интеллект.

По словам генерального директора Демиса Хассабиса и технического директора Корая Кавукчуоглу, Google Gemini 3 Pro представляет собой качественный скачок в развитии искусственного интеллекта, который устанавливает новые стандарты в рассуждениях, мультимодальности и агентских функциях.

Возможности Google Gemini 3 Pro

Новая модель Gemini 3 Pro демонстрирует прорывные результаты на всех основных тестах, значительно превосходя предыдущее поколение, Gemini 2.5 Pro.

  • Лидер в рассуждениях: Модель возглавляет рейтинг LMArena Leaderboard с рекордным показателем 1501 Elo. Она демонстрирует рассуждения на уровне PhD, показав лучшие результаты на сложнейших экзаменах:
    – Humanity’s Last Exam: 37.5% (без использования инструментов)
    – GPQA Diamond: 91.9%
  • Новый стандарт в математике: Gemini 3 Pro устанавливает новый рекорд в решении сложных математических задач, достигнув показателя 23.4% на MathArena Apex.
  • Переопределение мультимодальности: Модель демонстрирует превосходное понимание в различных контекстах:
    – 81% на MMMU-Pro (понимание университетских курсов)
    – 87.6% на Video-MMMU (работа с видео)
    – 72.1% на SimpleQA Verified (фактическая точность)

Это означает, что Gemini 3 Pro способна с высокой степенью надежности решать сложные проблемы в таких областях, как наука и математика. Gemini 3 Pro размещена в чате с Gemini, на сайте AI Studio или в поиске Google (если у пользователя имеется подписка AI Pro/Ultra).

Большинство чат-ботов работают только с текстом. Gemini 3 Pro может одновременно обрабатывать текст, картинки, видео, аудио и даже код, находя связи между ними.

Пример работы Gemini 3 Pro по запросу о жизни и творчестве Ван Гога, был создан «сайт» с его о биографией и картинами

Также Google представил новую платформу для разработчиков — Antigravity. Её основная идея — использовать ИИ (модель Gemini 3) не просто как помощника, а как самостоятельного агента, который может сам планировать и выполнять сложные задачи по написанию кода. Агенты имеют прямой доступ к редактору, терминалу и браузеру и могут сами проверять свой код.

Для обычных пользователей:

  • В приложении Gemini модель Gemini 3 станет доступна всем.
  • Подписчики сервисов Google AI Pro и Ultra получат расширенные функции, включая ИИ-поиск и доступ к агентам, которые могут выполнять задачи за пользователя.
  • Скоро появится режим «Deep Think» для более сложных задач (пока только для подписчиков Ultra).

Заявлено, что новая модель лучше справляется с длительными задачами, например, с управлением бизнес-процессами, и может быть полезна в повседневных делах.

Google также акцентирует внимание на безопасности Gemini 3, утверждая, что это их самая безопасная на сегодня модель, прошедшая проверки как внутренними экспертами, так и независимыми организациями.

По сути, Google расширяет доступ к своей ИИ-модели, встраивая её в разные сервисы — от приложений для смартфонов до инструментов для бизнеса. К сожалению в России в последнее время становится все более недоступным, а ее использование возможно через ВПН, а также сторонние сервисы или телеграм-боты, заявляющие функционал Gemini.

На фоне мощных апгрейдов ИИ Adobe выпустила обновление до версии 25.6.1 программы для монтажа Adobe Premiere Pro. Хоть это и не крупный релиз, но он содержит ряд полезных улучшений для повседневной работы, включая поддержку нового RAW-формата видео и новые инструменты на базе искусственного интеллекта.