Gemini 3.5 — это новое семейство ИИ-моделей Google, представленное на Google I/O 2026 (19 мая) 411. Первой и пока единственной публично доступной моделью линейки стала Gemini 3.5 Flash — и её главная сенсация в том, что «лёгкая» Flash-модель впервые обогнала прошлый флагман Gemini 3.1 Pro в большинстве агентских и кодинг-бенчмарков, при этом работая в ~4 раза быстрее конкурентов 1011. Gemini 3.5 Pro на момент анонса ещё проходит внутреннее тестирование и обещан «в следующем месяце» (т.е. в июне 2026) 611. Главный trade-off: за скорость и агентность заплатили глубоким рассуждением и работой с длинным контекстом — здесь 3.1 Pro по-прежнему выигрывает 1011.
Что именно вышло и где это работает
Gemini 3.5 Flash — это «Agentic Flash»: модель, сохранившая низкую задержку серии Flash, но получившая многошаговое рассуждение и оркестрацию инструментов, которые раньше были привилегией Pro 15. Релиз сразу в статусе GA (General Availability), без суффикса preview, внутренний идентификатор — gemini-3.5-flash-05-2026 15. По умолчанию включён Dynamic Thinking — модель сама решает, нужна ли цепочка рассуждений, и разработчику не надо вручную задавать «бюджет мышления» 15.
Где доступна сразу после анонса:
- Приложение Gemini (Android/iOS/ПК) и AI Mode в Google Search — для всех, включая бесплатный тариф 46
- Google AI Studio, Android Studio, Gemini API 49
- Antigravity 2.0 — агентная среда разработки от Google 711
- Gemini Enterprise и Gemini Spark (персональный ИИ-агент) 911
Контекстное окно — 1 миллион токенов 11.
Бенчмарки: где Flash побила Pro, а где провалилась
Бенчмарк | Gemini 3.5 Flash | Gemini 3.1 Pro | Кто ещё |
|---|---|---|---|
| Terminal-Bench 2.1 (кодинг) | 76,2% 411 | 70,3% 10 | GPT-5.5: 78,2% 7 |
| MCP Atlas (инструменты) | 83,6% 49 | 78,2% 10 | обходит Opus 4.7 и GPT-5.5 7 |
| Finance Agent v2 | 57,9% 7 | 43% 7 | конкуренты ~51% 7 |
| GDPval-AA (Elo, агенты) | 1656 411 | 1317–1314 1011 | Sonnet 4.6: 1676; Opus 4.7: 1753; GPT-5.5: 1769 7 |
| CharXiv Reasoning | 84,2% 49 | — | лучший в таблице 7 |
| MMMU-Pro (мультимодал) | 83,6% 7 | — | лучший в таблице 7 |
| Humanity's Last Exam | 40,2% 710 | 44,4% 710 | Opus 4.7: 46,9% 7 |
| ARC-AGI-2 | 72,1% 710 | 77,1% 710 | — |
| MRCR v2 (128k контекст) | отстаёт на 7,6 балла 10 | лидер 10 | — |
Картина бьющая по интуиции: согласно NxCode, Flash выигрывает в 11 из 15 опубликованных бенчмарков против 3.1 Pro 10. По GDPval-AA — на 26% выше прошлого Pro 1114. Но как только задача требует длинного академического рассуждения, головоломок или поиска «иголки в стоге сена» в длинном документе — 3.1 Pro возвращает корону 1011.
Скорость как главный аргумент
По независимому замеру Artificial Analysis, Gemini 3.5 Flash выдаёт 289 токенов в секунду 71114:
- в 4,3 раза быстрее Claude Opus 4.7 (67 t/s) 7
- в 4,1 раза быстрее GPT-5.5 (71 t/s) 7
- в 2,1 раза быстрее самой Gemini 3.1 Pro (135 t/s) 7
- на ~70% быстрее предыдущей Gemini 3 Flash 10
При этом по общему Intelligence Index от Artificial Analysis модель идёт вровень с 3.1 Pro и Claude Opus 4.7 7. Для агентов это даёт кумулятивный эффект: цикл «вызов инструмента → ответ → следующий шаг» прокручивается в 4 раза быстрее, превращая часы в минуты 14.
Демонстрационный кейс от Google: на Antigravity 2.0 поставили задачу собрать рабочую ОС с нуля. Результат — 12 часов, 93 параллельных субагента, 15 000+ обращений к модели, 2,6 млрд обработанных токенов, бюджет менее $1000 API-кредитов; агенты написали каждую строку сами — от ядра до управления памятью 710.
Цены и скрытые подвохи
$1,50 за 1M входящих токенов / $9,00 за 1M исходящих 1011. И здесь вердикт неоднозначный — есть два взгляда:
- Дешевле флагмана: на 25% дешевле Gemini 3.1 Pro по версии NxCode 10, на 40% дешевле — по версии ITC 11. Для бизнеса считают так: компания, обрабатывающая 1 трлн токенов в день, перевезя 80% нагрузки на 3.5 Flash, сэкономит >$1 млрд в год 14.
- Дороже предшественника: при этом 3.5 Flash в 3 раза дороже Gemini 3 Flash Preview, которую она заменяет, и в 6 раз дороже Gemini 3.1 Flash-Lite 10. Саймон Уиллисон комментирует: «все три крупные AI-лаборатории, похоже, прощупывают ценовую устойчивость своих API-клиентов» 10.
Скрытая регрессия в API: при миграции с gemini-3-flash-preview параметр thinking_level по умолчанию опустился с high до medium. Если не выставить явно — получите «более тихую и менее сообразительную» модель, чем была вчера 10.
Контекст: новая частота релизов
Gemini 3.1 Pro вышел в феврале 2026 и возглавил Artificial Analysis Intelligence Index с 77,1% на ARC-AGI-2 11. Появление Flash-модели, бьющей этот флагман по агентским задачам, всего через три месяца — сигнал, что традиционная граница «флагман vs экономичный» размывается 11. ITC прямо называет это «изменением правил игры»: новая модель каждые 2–3 месяца с показателями выше предыдущего флагмана 11.
В экосистему Gemini 3.5 встроены и другие анонсы I/O 2026: Gemini Omni (мультимодальная генерация видео из текста/звука/изображений; первая версия Omni Flash для подписчиков AI Plus/Pro/Ultra) 14, Gemini Spark (фоновый ИИ-агент на базе именно 3.5 Flash, бета в AI Ultra в США) 19, переработанные тарифы — добавлен AI Ultra за $100, топ-уровень снижен до $200 (по другой версии — наоборот: AI Ultra подешевел до $100) 14. Уточнить здесь сложно: источники 1 и 4 описывают тарифную перестройку слегка по-разному.
Что важно знать про Gemini 3.5 Pro
Конкретных данных мало. Сундар Пичаи подтвердил: модель проходит внутреннее тестирование и выйдет «в следующем месяце» 6, то есть ориентировочно июнь 2026 11. Никаких бенчмарков, цен и архитектурных деталей в источниках на 21 мая 2026 нет.
Когда что использовать (практический вывод)
- Берите 3.5 Flash, если: агентские циклы, кодинг, вызовы инструментов, многошаговые рабочие процессы, высокая пропускная способность, чат-интерфейсы реального времени 101114.
- Оставайтесь на 3.1 Pro, если: академически сложные одиночные запросы, глубокое рассуждение, ARC-головоломки, задачи «иголка в стоге сена» на контексте 128k+ 1011.
- Ждите 3.5 Pro (июнь 2026), если: нужна максимальная глубина рассуждения на новом поколении и готовы потерпеть месяц 611.
Оговорка по источникам: все цифры скорости и бенчмарков опираются преимущественно на данные Google и один независимый замер Artificial Analysis 711; внешней верификации экономии «$1 млрд в год» и кейса «ОС за 12 часов» пока нет — это маркетинговые демонстрации самой Google 714. Источники 3, 8, 13, 17 оказались недоступны (заглушки сервисов и капчи), 2, 5, 12 — общеконтекстные и не содержат данных конкретно про 3.5.
Главные анонсы: Gemini 3.5 Flash — новая высокоскоростная модель, уже доступная бесплатно, в 4 раза быстрее аналогов и дешевле, с высокими ...
ИИ-модели Gemini 3.5 Flash. Критики отмечают, что качество выдачи поисковика в последние годы стало хуже, несмотря на официальные заявления Google. Согласно
В этом видео мы разберем главные анонсы презентации Google I/O 2026 - новая модель Gemini 3.5 Flesh и модель генерации видео Gemini Omni, ИИ ...
Глава Alphabet Сундар ... 3.5, мультимодальную модель Gemini Omni, новые версии AI Mode в поиске, обновленную среду разработки Antigravity 2.0, а также обновления Workspace и Google Labs...
на другой языковой модели от OpenAI — GPT-3.5 — улучшенной версии модели GPT-3. 14 марта 2023 года была выпущена языковая модель GPT-4, доступная тестировщикам
Google представила Gemini 3.5 Flash — сверхбыстрая ИИ-модель уже доступна бесплатно ... этом обеспечивает заметно более быстрые ответы.
На конференции I/O 2026 Google представил новое семейство моделей Gemini 3.5. Первой вышла младшая версия — 3.5 Flash, и компания сразу назвала ее своей сильнейшей моделью для агентов и...
Один из важнейших анонсов Google I/O 2026 — обновление флагманского семейства ИИ-моделей Gemini. Пока доступна только облегчённая Gemini 3.5 ...
Новая модель демонстрирует значительное улучшение производительности и скорости по сравнению с предыдущими версиями. ... Gemini 3.5 Flash доступна для всех пользова...
Gemini 3.5 Flash превосходит Gemini 3.1 Pro в 11 из 15 benchmarks при цене в 75% — но стоит в 3 раза дороже, чем Flash, который он заменяет.
2 дня назад · В бенчмарках модель набрала 76,2% на Terminal-Bench 2.1 (кодинг), 1656 Elo на GDPval-AA (реальные агентские задачи) и 83,6% на MCP Atlas ( ...
при этом текущие ведущие модели, такие как Google Gemini 2.0 Flash (1,3 % точности) и OpenAI GPT-4.5 (0 %), значительно уступают людям (в среднем 60 %
При этом Gemini 3.5 Flash хорошо подходит и для программирования. В бенчмарке Terminal-Bench 2.1 она отстаёт от GPT-5.5 всего на 2 процентных ...
1 день назад · В бенчмарках модель показала сильные результаты: 76,2% на Terminal-Bench 2.1 (кодинг), 1656 Elo на GDPval-AA (реальные агентные задачи) и 83,6% ...
Ключевые бенчмарки Gemini 3.5 Flash: сравнение с Gemini 3.1 Pro ; Finance Agent v2, 57.9%, 43.0% ; GDPval-AA (Elo), 1656, 1314 ; CharXiv Reasoning ...
Бенчмарки, цены ($3/$15 против $0,50/$3), производительность в кодинге, использование компьютера и контекстное окно в 1 млн токенов. Какая модель среднего ...
В бенчмарках модель набрала 76.2% на Terminal-Bench 2.1 (кодирование), 1656 Elo на GDPval-AA (реальные агентские задачи) и 83.6% на MCP Atlas ( ...
Источники