Новая ИИ-модель Google Gemini 3 Pro получила ряд продвинутых возможностей в фото и видео. Она позволяет преобразовывать статичные изображения в видео (с помощью движка Veo 3) в разрешении 720р, а также «понимает» загруженные фотографии: распознает текст, сцену, объекты и т.д.
Для начала детально разберем фото и видеовозможности новой нейронки.
- Для фото: Загрузите снимок (от сложной архитектурной схемы до семейного фото). Модель не только опишет, что на нем изображено, но и ответит на уточняющие вопросы: «Каков исторический стиль этого здания?», «Предложи идею для поста в соцсетях на основе этой фотографии» или «Составь список ингредиентов, которые видны на этой полке».
- Для видео: Новый ИИ способен «отсмотреть» часовую лекцию, спортивный матч или видеоблог. Она не просто расшифрует речь, но и выделит ключевые моменты, проанализирует действия и сгенерирует структурированный конспект. Например, после анализа футбольного матча он может составить план тренировок, указав на слабые места в обороне команды.
В чем особенности Google Gemini 3 Pro?
Модель не просто распознает объекты на изображении или в видео, а интерпретирует их смысл и взаимосвязи.
Вместо простых фильтров модель предлагает семантическое редактирование, изменяя саму суть изображения.
Нейросеть может изменить освещение на фото с «пасмурного» на «золотой час», убрать нежелательные отражения с витрины или стекла, а также работать со сложными эффектами вроде градиентов и теней, придавая снимку совершенно новое настроение.
С контекстным окном в 1 миллион токенов модель работает с невероятно большими объемами данных. Это позволяет:
- Обработать десятки старых семейных фото и рукописных рецептов, чтобы автоматически создать и оформить уникальную семейную кулинарную книгу.
- Загрузить целый учебный курс из видеолекций и PDF-пособий и получить от модели готовые учебные материалы: презентации, карточки для запоминания и сжатые конспекты.
По сути, Gemini 3 Pro становится вашим личным креативным дизайнером, видео-редактором и аналитиком, способным понять ваш замысел и воплотить его в жизнь через фото и видео.
Контекст релиза Google Gemini 3 Pro
Руководство Google сообщает, что двумя ключевыми драйверами роста компани стали поиск с ИИ, которым ежемесячно пользуются 2 миллиарда человек, и приложение Gemini, достигшее аудитории в 650 миллионов пользователей. Более 70% клиентов Google Cloud используют искусственный интеллект.

По словам генерального директора Демиса Хассабиса и технического директора Корая Кавукчуоглу, Google Gemini 3 Pro представляет собой качественный скачок в развитии искусственного интеллекта, который устанавливает новые стандарты в рассуждениях, мультимодальности и агентских функциях.
Возможности Google Gemini 3 Pro
Новая модель Gemini 3 Pro демонстрирует прорывные результаты на всех основных тестах, значительно превосходя предыдущее поколение, Gemini 2.5 Pro.

- Лидер в рассуждениях: Модель возглавляет рейтинг LMArena Leaderboard с рекордным показателем 1501 Elo. Она демонстрирует рассуждения на уровне PhD, показав лучшие результаты на сложнейших экзаменах:
– Humanity’s Last Exam: 37.5% (без использования инструментов)
– GPQA Diamond: 91.9% - Новый стандарт в математике: Gemini 3 Pro устанавливает новый рекорд в решении сложных математических задач, достигнув показателя 23.4% на MathArena Apex.
- Переопределение мультимодальности: Модель демонстрирует превосходное понимание в различных контекстах:
– 81% на MMMU-Pro (понимание университетских курсов)
– 87.6% на Video-MMMU (работа с видео)
– 72.1% на SimpleQA Verified (фактическая точность)
Это означает, что Gemini 3 Pro способна с высокой степенью надежности решать сложные проблемы в таких областях, как наука и математика. Gemini 3 Pro размещена в чате с Gemini, на сайте AI Studio или в поиске Google (если у пользователя имеется подписка AI Pro/Ultra).
Большинство чат-ботов работают только с текстом. Gemini 3 Pro может одновременно обрабатывать текст, картинки, видео, аудио и даже код, находя связи между ними.

Также Google представил новую платформу для разработчиков — Antigravity. Её основная идея — использовать ИИ (модель Gemini 3) не просто как помощника, а как самостоятельного агента, который может сам планировать и выполнять сложные задачи по написанию кода. Агенты имеют прямой доступ к редактору, терминалу и браузеру и могут сами проверять свой код.
Для обычных пользователей:
- В приложении Gemini модель Gemini 3 станет доступна всем.
- Подписчики сервисов Google AI Pro и Ultra получат расширенные функции, включая ИИ-поиск и доступ к агентам, которые могут выполнять задачи за пользователя.
- Скоро появится режим «Deep Think» для более сложных задач (пока только для подписчиков Ultra).


Заявлено, что новая модель лучше справляется с длительными задачами, например, с управлением бизнес-процессами, и может быть полезна в повседневных делах.
Google также акцентирует внимание на безопасности Gemini 3, утверждая, что это их самая безопасная на сегодня модель, прошедшая проверки как внутренними экспертами, так и независимыми организациями.





По сути, Google расширяет доступ к своей ИИ-модели, встраивая её в разные сервисы — от приложений для смартфонов до инструментов для бизнеса. К сожалению в России в последнее время становится все более недоступным, а ее использование возможно через ВПН, а также сторонние сервисы или телеграм-боты, заявляющие функционал Gemini.
На фоне мощных апгрейдов ИИ Adobe выпустила обновление до версии 25.6.1 программы для монтажа Adobe Premiere Pro. Хоть это и не крупный релиз, но он содержит ряд полезных улучшений для повседневной работы, включая поддержку нового RAW-формата видео и новые инструменты на базе искусственного интеллекта.

























