Модель поддерживает мультимодальный ввод (текст, изображения, видео, аудио и PDF) и принимает около 1 млн токенов контекста. Максимальный объем ответа примерно 65 000 токенов.
Стоимость
На момент написания статьи модель является самым дешевым предложением от большой тройки (Google, OpenAI, Anthropic):
- $0,25 за 1 млн входных токенов;
- $1,50 за 1 млн выходных токенов.
Бенчмарк DeepMind. Данные: Google.
Запуском Gemini 3.1 Flash-Lite Google делает шаг в сторону доступности ИИ-моделей для массового рынка, сокращая барьеры входа для разработчиков.
Быстродействие и производительность
По данным Artificial Analysis, Gemini 3.1 Flash-Lite превосходит предыдущую версию Gemini 2.5 Flash по времени до получения первого токена ответа в 2,5 раза и по скорости вывода на 45% при сохранении того же или более высокого качества.
Сравнение производительности. Данные: Artificial Analysis.
По результатам голосования на платформе Arena по состоянию на 4 марта 2026 Gemini 3.1 Flash-Lite занимает 32-е место в рейтинге выполнения задач в таких областях, как математика, программирование, литературное творчество и других.
Нововведение: регулируемая глубина мышления
Инновация Flash-Lite — адаптивные уровни мышления. Разработчики могут выбирать глубину «мышления» модели для конкретной задачи — от минимальной, для сверхбыстрой обработки простых запросов, до более углубленной, для сложных логических или многозадачных операций.
Меню выбора уровня мышления Gemini 3.1 Flash-Lite. Данные: Incrypted.
Это позволяет экономить ресурсы и настраивать модель под разные рабочие нагрузки — от классификации до генерации сложных интерфейсов, симуляций и мультимодальных ответов.