Расскажи про новую модель гемини 3.5 флеш

Gemini 3.5 Flash: Frontier-интеллект на скорости Flash — полный разбор релиза Google I/O 2026

19 мая 2026 года на конференции Google I/O компания Google представила Gemini 3.5 Flash — первую модель новой линейки 3.5, которая впервые в истории Gemini обгоняет предыдущий флагман (Gemini 3.1 Pro) на ключевых бенчмарках по коду и агентным задачам, работая при этом в 4 раза быстрее и примерно на 40% дешевле. Модель сразу стала общедоступной (GA) и развёрнута как дефолтная в приложении Gemini и AI Mode в Google Search для миллиардов пользователей. Gemini 3.5 Pro отложена до июня 2026 года.

Контекст релиза и место в линейке Gemini

Gemini — семейство мультимодальных больших языковых моделей, разработанное Google DeepMind и являющееся преемником LaMDA и PaLM 2; впервые анонсировано 6 декабря 2023 года и включает в себя ветки Pro, Deep Think, Flash и Flash Lite 9. На момент релиза 3.5 Flash приложение Gemini насчитывало более 900 миллионов ежемесячных активных пользователей — рост с 400 миллионов годом ранее 6.

Релиз состоялся 19 мая 2026 года на двухчасовой кейноуте Google I/O 2026 в Маунтин-Вью, где также были представлены 24/7 персональный AI-агент Gemini Spark, Antigravity 2.0 и переосмысление поиска 6. В официальном блоге Google формулировка звучит так: «Gemini 3.5 — это последнее семейство моделей, объединяющее frontier-интеллект с действием», и первой в серии выходит именно 3.5 Flash, ориентированная на агентов и кодирование 4. С момента запуска Gemini 3 (месяцем ранее, с моделями 3 Pro и 3 Deep Think) Google обрабатывает более 1 триллиона токенов в день через API 3.

Важно понимать терминологическую путаницу: в некоторых корпоративных источниках Google ранее анонсировал модель «Gemini 3 Flash» с ID gemini-3-flash-preview 37, которая в стабильной GA-версии стала называться gemini-3.5-flash без preview-суффикса 26. Внутренняя версия — 3.5-flash-05-2026 2.

Технические характеристики и спецификации

Согласно подробному разбору llm-stats, ключевые параметры модели следующие 2:

API model ID: gemini-3.5-flash (без preview-суффикса)
Контекстное окно: 1 048 576 входных токенов / 65 536 выходных токенов
Модальности: текст + изображения + аудио + видео на вход, текст на выход
Thinking: динамическое мышление включено по умолчанию
Использование инструментов: function calling, structured output, поиск-как-инструмент, исполнение кода
Knowledge cutoff: январь 2026 года

В документации Google Cloud для Gemini Enterprise Agent Platform отмечены несколько новых параметров управления моделью 7:

thinking_level — управляет глубиной внутреннего рассуждения (minimal, low, medium, high) и заменяет старый параметр thinking_budget, использовавшийся в Gemini 3
Thought signatures — более строгая валидация для надёжности многошаговых вызовов функций
media_resolution — управление обработкой изображений (low/medium/high/ultra high), причём ultra high доступен только для модальности IMAGE
Мультимодальные function responses — функции могут возвращать изображения и PDF, а не только текст
Streaming function calling — потоковая передача аргументов вызова функций

Технические лимиты для изображений: до 3000 изображений в одном промпте, максимум 7 МБ через inline-данные или 30 МБ через Google Cloud Storage, поддерживаемые MIME-типы: PNG, JPEG, WEBP, HEIC, HEIF 7.

Бенчмарки: как Flash победил Pro

Главная сенсация релиза — Gemini 3.5 Flash превосходит более крупную Gemini 3.1 Pro на ключевых агентных и кодинг-бенчмарках. Конкретные цифры из официального блога Google 4:

Terminal-Bench 2.1: 76.2%
GDPval-AA: 1656 Elo
MCP Atlas: 83.6%
CharXiv Reasoning (мультимодальное понимание): 84.2%
Скорость: в 4 раза быстрее (по выходным токенам в секунду), чем другие frontier-модели

На опубликованной Google таблице 3.5 Flash лидирует среди всех представленных моделей по пяти отдельным оценкам, включая Claude Opus 4.7 и GPT-5.5 6. По размещению в Artificial Analysis Intelligence Index модель попадает в верхний правый квадрант (высокий интеллект + высокая скорость) 24.

При этом данные из более ранней публикации Google по «Gemini 3 Flash» (фактически предварительная версия той же модели) дают дополнительные цифры по знаниевым бенчмаркам 3:

GPQA Diamond (PhD-level reasoning): 90.4%
Humanity's Last Exam (без инструментов): 33.7%
MMMU Pro: 81.2% — сопоставимо с Gemini 3 Pro

Google также подчёркивает эффективность: на максимальном уровне мышления модель использует на 30% меньше токенов в среднем, чем Gemini 2.5 Pro, при выполнении повседневных задач 3.

Однако независимый разбор фиксирует и слабые стороны: 3.5 Flash проигрывает Gemini 3.1 Pro на длинноконтекстных задачах (MRCR v2 на 128k) и на Humanity's Last Exam, где важна глубина «сырых» знаний, а не агентность 6. Аналитик Build Fast with AI отмечает: «отрыв в 14.9 пункта на Finance Agent v2 — это не шум», но для работы с длинными документами и задачами на чистые знания Gemini 3.1 Pro остаётся более безопасным выбором до выхода 3.5 Pro 6.

Цены и экономика

Цена API делает 3.5 Flash особенно агрессивным предложением 2:

$1.50 за миллион входных токенов
$9.00 за миллион выходных токенов
$0.15 за миллион токенов кешированного ввода
Non-global регионы: $1.65 / $9.90

Это примерно на 40% дешевле Gemini 3.1 Pro 610. Питч Google звучит так: «больше не "дешевле, если вы готовы мириться с худшим качеством" — это frontier-интеллект на Flash-латентности» 2. В блоге Google это формулируется как «выталкивание Парето-границы качества против цены и скорости» 3.

Практические последствия для рынка, как их формулирует llm-stats 2:

Долгогоризонтные агентные задачи — то, что раньше занимало у разработчика дни или у аудитора недели, 3.5 Flash может сжать в часы, часто менее чем за половину стоимости других frontier-моделей.
Многошаговое использование инструментов — модель надёжно выполняет multi-turn function calling, планирует, строит, итерирует.

В блоге Google подтверждается тот же нарратив: в связке с обновлённым harness Antigravity 3.5 Flash становится «мощным движком для развёртывания коллаборативных субагентов» под человеческим супервизированием 4.

Доступность и каналы распространения

Gemini 3.5 Flash стала GA в день анонса 19 мая 2026 года и развёрнута сразу через множество каналов 234:

Для конечных пользователей:

Приложение Gemini (как дефолтная модель)
AI Mode в Google Search (как дефолтная модель)

Для разработчиков:

Gemini API
Google AI Studio
Android Studio
Gemini CLI
Google Antigravity — новая agent-first платформа разработки

Для предприятий:

Vertex AI
Gemini Enterprise
Gemini Enterprise Agent Platform

Согласно changelog Gemini API на русском, в тот же день — 19 мая 2026 — была запущена публичная предварительная версия управляемых агентов: разработчики могут создавать автономные stateful-агенты, работающие в безопасных изолированных Linux-окружениях на серверах Google 5. Также вышел универсальный управляемый агент Antigravity Agent (antigravity-preview-05-2026), способный автономно планировать, рассуждать, писать и выполнять код, управлять файлами и просматривать веб-страницы внутри песочницы-контейнера 5.

Контекст других недавних релизов в API: 7 мая 2026 вышла GA-версия gemini-3.1-flash-lite, оптимизированная для скорости и экономии, а preview-версия gemini-3.1-flash-lite-preview устаревает 11 мая и отключается 25 мая 2026 5. 22 апреля 2026 в GA вышел пакет gemini-embedding-2, поддерживающий мультимодальный поиск (включая встраивание изображений) 5.

Демонстрации возможностей и сценарии использования

Официальная страница DeepMind иллюстрирует возможности 3.5 Flash набором демонстраций 1:

Генерация шести UI-вариантов платёжного интерфейса менее чем за 60 секунд
Создание 64 фрактальных вариаций на высокой скорости
Поглощение научной статьи об AlphaGo и автономное построение интеллектуальной игры на её основе
Координация множественных workflow для генерации и доработки бренда для фандрейзинга с минимальным вводом
Превращение текстового описания в полностью интерактивные HTML-компоненты
Координация множественных агентов для создания песни с помощью библиотеки Strudel
Координация команды специализированных агентов для проектирования и постройки виртуального города
Развёртывание параллельных агентов для автоматического переименования и структурирования «грязных» датасетов
Развёртывание агентов для непрерывной доработки игры в реальном времени

Google прямо называет 3.5 Flash своей самой впечатляющей моделью для агентных workflow и подчёркивает её применимость для разработки новых приложений, поддержки кодовых баз, подготовки финансовых документов 34. Felloai отмечает, что модель «настроена под кодинг и агентные задачи — long-horizon работу, где ИИ планирует, вызывает инструменты и итерирует, а не отвечает на одиночный вопрос» 10.

Что не вышло и что впереди

Самый громкий неприятный момент анонса — Gemini 3.5 Pro не была выпущена 19 мая. Google подтвердил, что Pro-версия уже используется внутри компании и будет выпущена в следующем месяце (июнь 2026) 2410. По данным Felloai, на этом моменте презентации в зале I/O аудитория «застонала», когда Сундар Пичаи озвучил эту новость 10.

Это означает, что для пользователей, чья работа критично зависит от глубины знаний и длинного контекста (более 128k), стратегически разумно подождать релиза 3.5 Pro или продолжать использовать Gemini 3.1 Pro 610.

Стратегическое значение релиза

Главный месседж аналитиков совпадает: Google «сдвинул frontier-линию вниз, на уровень Flash» 2. До этого утра по индустрии работала ментальная модель из двух уровней: «Pro для сложных задач, Flash для пропускной способности». Gemini 3.5 Flash сжимает это различие на нагрузках, важных для агентов 26.

Build Fast with AI формулирует это как «инверсию исторической иерархии Pro/Flash в тех областях, которые больше всего волнуют разработчиков» 6. Felloai подчёркивает беспрецедентность: «дешёвый, быстрый Flash-уровень теперь побеждает прежнего флагмана» — Google никогда раньше так не делал 10.

С точки зрения конкуренции, релиз позиционирует Google против Claude Opus 4.7 (Anthropic) и GPT-5.5 (OpenAI), которые модель обходит на пяти отдельных оценках в таблице бенчмарков Google 6. Безусловно, методология бенчмаркинга Google требует проверки независимыми сторонами — компания указывает методологию по адресу deepmind.google/models/evals-methodology/gemini-3-5-flash 1.

Выводы

Gemini 3.5 Flash — это, вероятно, самый стратегически важный релиз Flash-модели в истории Google. Сводный итог:

Производительность инвертировала иерархию. Впервые Flash-уровень обходит предыдущий Pro-флагман на агентных и кодинг-бенчмарках: 76.2% Terminal-Bench 2.1, 83.6% MCP Atlas, 1656 Elo GDPval-AA, 84.2% CharXiv Reasoning 410.
Экономика крайне агрессивна. $1.50/$9.00 за миллион токенов — на 40% дешевле 3.1 Pro и при этом в 4 раза быстрее по выходным токенам в секунду 2610.
Дефолт для миллиардов. Модель моментально стала дефолтной в Gemini-приложении (900M+ MAU) и в AI Mode в Search 6.
Полный агентный стек. Релиз сопровождён управляемыми агентами в публичном превью, агентом Antigravity, и обновлённой harness Antigravity 2.0 — Google недвусмысленно делает ставку на агентный год 456.
Слабые места честно признаны. На длинном контексте (MRCR v2 128k) и Humanity's Last Exam Gemini 3.1 Pro по-прежнему лидирует, и до релиза 3.5 Pro в июне 2026 года это остаётся фактором для knowledge-heavy задач 610.

Рекомендации:

Разработчикам агентов и кодинга: немедленно мигрировать с 3.1 Pro на gemini-3.5-flash — экономия 40% при росте качества на целевых задачах 26.
Командам, работающим с длинными документами и глубокими знаниевыми задачами: дождаться 3.5 Pro в июне 2026, либо использовать гибридную маршрутизацию между 3.5 Flash (агентные шаги) и 3.1 Pro (длинноконтекстный retrieval) 610.
Корпоративным клиентам: оценить Gemini Enterprise Agent Platform с новыми параметрами thinking_level и media_resolution для более гранулярного управления стоимостью/качеством 7.
Конечным пользователям: ничего делать не нужно — открыв приложение Gemini сегодня, вы уже работаете с 3.5 Flash 6.

Релиз закрепляет тренд 2026 года: frontier-интеллект перестаёт быть привилегией «топ-моделей» и становится новым базовым уровнем — а ценовая и скоростная планка одновременно опускаются вниз. Следующий ход за OpenAI и Anthropic, а Google уже припас 3.5 Pro «в рукаве» на июнь.

10 источников

1Gemini 3.5 Flash

deepmind.google

Gemini 3.5 Flash delivers intelligence that rivals large flagship models, at the speeds you have come to expect from the Flash series.

2Gemini 3.5 Flash: Benchmarks, Pricing, and Complete Specs

llm-stats.com

The headline claim from Google's announcement is unusual for a Flash release: 3.5 Flash beats Gemini 3.1 Pro on most coding and agentic benchmarks, while running roughly 4x faster than comparable frontier models, and often at less than half the cost. The pitch is no longer "cheaper if you can tolerate worse".

3Gemini 3 Flash: frontier intelligence built for speed

blog.google

Gemini 3 Flash is our latest model with frontier intelligence built for speed that helps everyone learn, build, and plan anything — faster.

4Gemini 3.5: frontier intelligence with action

blog.google

At Google I/O we released Gemini 3.5, our latest series of models combining frontier intelligence with action.

5Примечания к выпускам | Gemini API | Google AI for Developers

ai.google.dev

Gemini 3 billing for Grounding with Google Search will begin on January 5, 2026. December 4, 2025. Deprecation announcement: The gemini-2.5-flash-image-preview ...

6Google I/O 2026: Gemini 3.5 Flash, Spark & Agentic AI

buildfastwithai.com

Everything announced at Google I/O 2026: Gemini 3.5 Flash benchmarks, $1.50/M API pricing, Gemini Spark agent, Antigravity 2.0, and more — for developers.

7Gemini 3 Flash | Gemini Enterprise Agent Platform | Google Cloud Documentation

docs.cloud.google.com

Learn about Gemini 3 Flash, Google's latest Gemini Flash model ... Release date: December 17, 2025. Supported languages, See Supported languages ...

8Gemini 3.5 Flash: Google's Fastest Agentic Model

datacamp.com

Google launched Gemini 3.5 Flash at I/O 2026. Here's what practitioners need to know: benchmark scores, agentic capabilities, real-world deployments, and availability.

9Gemini (language model) - Wikipedia

en.wikipedia.org

On March 3, 2026, Google released Gemini 3.1 Flash Lite to Developers in the Google API. On April 2, 2026, Google released Gemma 4 which is ...

10Gemini 3.5 Review: What Google Launched at I/O 2026

felloai.com

Google launched Gemini 3.5 Flash at I/O 2026, and it beats Gemini 3.1 Pro on coding while running 4x faster. See benchmarks, pricing, and how to use it.

Источники

1Gemini 3.5 Flash 2Gemini 3.5 Flash: Benchmarks, Pricing, and Complete Specs 3Gemini 3 Flash: frontier intelligence built for speed 4Gemini 3.5: frontier intelligence with action 5Примечания к выпускам | Gemini API | Google AI for Developers 6Google I/O 2026: Gemini 3.5 Flash, Spark & Agentic AI 7Gemini 3 Flash | Gemini Enterprise Agent Platform | Google Cloud Documentation 8Gemini 3.5 Flash: Google's Fastest Agentic Model