Купить крипто Рынки Спот ФьючерсыGOLD Сбережения Центр событий

Еще

Компания Google представила новую возможность для своей ИИ-модели Gemini 3 Flash — Agentic Vision, которая существенно расширяет способность системы анализироваКомпания Google представила новую возможность для своей ИИ-модели Gemini 3 Flash — Agentic Vision, которая существенно расширяет способность системы анализирова

Google представила Agentic Vision в Gemini 3 Flash для более глубокого анализа изображений

Источник: Incrypted

2026/02/01 18:50

3м. чтение

Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

ИИ-модель Gemini 3 Flash получила новую функцию Agentic Vision.
Так Gemini научилась «думать и действовать» с изображениями через выполнение кода.
В дальнейшем планируют интегрировать, например, веб-поиск изображений.

Компания Google представила новую возможность для своей ИИ-модели Gemini 3 Flash — Agentic Vision, которая существенно расширяет способность системы анализировать сложные изображения, включая мелкие детали вроде серийных номеров или текста на сложных схемах.

Обновление усиливает направление развития агентных моделей, которые не только генерируют ответы, но и выполняют промежуточные действия для достижения более точного результата.

В Google назвали это «новым рубежом возможностей ИИ». Agentic Vision внедряет визуальный цикл Think, Act, Observe («Думай, действуй, наблюдай») в задачи понимания изображений:

think (думай) — модель анализирует запрос пользователя и исходное изображение, формируя многошаговый план;
oct (действуй) — Gemini генерирует и выполняет Python-код для активной работы с изображением (кадрирование, поворот, аннотации) или его анализа (вычисления, подсчет объектов и т. п.);
Observe (наблюдай) — измененное изображение добавляется в контекст модели, что позволяет еи повторно оценить данные перед финальным ответом.

Благодаря этому Gemini 3 Flash лучше работает с детализированными визуальными данными. Среди ключевых механик:

планирование — создание пошаговой стратегии анализа изображения;
зумирование — автоматическое приближение к мелким элементам;
аннотации — возможность размечать изображение для «заземления» логики модели;
визуальная математика и построение графиков — разбор плотных таблиц и выполнение Python-кода для визуализации результатов.

Функция уже используется через API и демонстрируется в Google AI Studio, в частности:

Детальная инспекция изображений: платформа PlanCheckSolver.com, которая применяет ИИ для проверки строительных планов, повысила точность на 5% после активации выполнения кода в Gemini 3 Flash. Модель генерирует Python-код для вырезания отдельных фрагментов (например, краев крыши или секций здания) и повторно добавляет их в контекст для проверки соответствия сложным нормам.
Аннотация изображений: в примере из приложения Gemini модели нужно было посчитать пальцы на руке. Чтобы избежать ошибок, она использовала Python для нанесения ограничивающих рамок и числовых меток на каждый палец, создав «визуальный черновик» для точного подсчета.
Визуальная математика: Agentic Vision позволяет обрабатывать плотные таблицы и строить графики через Matplotlib. Вместо вероятностных оценок модель передает вычисления в детерминированную Python-среду.

В Google сообщили, что это лишь начало развития Agentic Vision. Компания работает над тем, чтобы больше действий (например, вращение изображений или визуальная математика) запускались без явной подсказки пользователя.

Также исследуется интеграция новых инструментов — в частности веб-поиска и обратного поиска изображений, а возможность планируют распространить на другие размеры моделей Gemini, не только Flash.

Напомним, что ранее Apple подтвердила многолетнее партнерство с Google. Следующее поколение Apple Foundation Models будет построено на базе моделей Gemini и облачной инфраструктуры Google. Они станут основой функций Apple Intelligence, включая обновленную персонализированную Siri.

Получите 20 USDT за 1 минуту

Внесите 100$ и разблокируйте позиции GOLD на 300$

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Аналитик предупреждает: апрельский рост Bitcoin может предшествовать краху в мае-июне

Кратко: Аналитик Аарон Дишнер предупреждает, что апрельское ралли BTC — это обманчивое движение в рамках более крупного медвежьего рынка. Исторические модели годов дна показывают апрельские ралли облегчения

Blockonomi2026/04/13 07:15

UFC Freedom 250 в Белом доме: Crypto.com выделяет бонусный пул в 1 000 000 $ CRO для бойцов – Криптоновости Биткоин новости

Статья UFC Freedom 250 в Белом доме: Crypto.com выделяет бонусный пул в $1 миллион CRO для бойцов – Crypto News Bitcoin News появилась на BitcoinEthereumNews

BitcoinEthereumNews2026/04/13 07:26

EUR/USD испытывает трудности на фоне роста неприятия риска после провала переговоров между США и Ираном

Публикация EUR/USD испытывает трудности на фоне роста неприятия риска после провала переговоров США и Ирана появилась на BitcoinEthereumNews.com. EUR/USD ослабевает на фоне настроений неприятия риска

BitcoinEthereumNews2026/04/13 07:29

Объединяйтесь для 10 млн USDT

200К$ в золоте и mystery box для ранних участников

Новости 24/7 в прямом эфире

Еще

JPMorgan Chase принимает биткоин в качестве залога, что свидетельствует об институциональном признании и потенциальном влиянии на рынок.

Автор: Vivek Sen09:56

Институциональные участники сосредоточены на инфраструктуре XRP Ledger, в то время как розничные инвесторы демонстрируют неопределённые настроения. Подчёркивается, что выбор момента является критически важным.

Автор: Ripple Bull Winkle | Crypto Researcher 🚀🚨09:01

Ethereum, Bitcoin и Ripple демонстрируют значительную активность, что указывает на заметные изменения на рынке.

Автор: Ripple Bull Winkle | Crypto Researcher 🚀🚨08:16

Axiology получает одобрение регуляторов ЕС на использование блокчейна для рынков капитала с применением XRPL.

Автор: Ripple Bull Winkle | Crypto Researcher 🚀🚨08:01

Недельный RSI по XRP указывает на редкий сигнал, который исторически связан с существенными восходящими движениями и подчёркивает возможное упущение со стороны трейдеров.

Автор: Ripple Bull Winkle | Crypto Researcher 🚀🚨07:01