GB200 NVL72 от NVIDIA устанавливает новый рекорд STAC-AI для вывода LLM в финансовой торговле, обеспечивая производительность до 3,2 раза выше архитектуры Hopper. (Подробнее)GB200 NVL72 от NVIDIA устанавливает новый рекорд STAC-AI для вывода LLM в финансовой торговле, обеспечивая производительность до 3,2 раза выше архитектуры Hopper. (Подробнее)

NVIDIA Blackwell разбивает финансовый AI-бенчмарк с ускорением в 3,2 раза

2026/03/06 02:17
3м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

NVIDIA Blackwell разбивает финансовый ИИ-бенчмарк с увеличением скорости в 3,2 раза

Iris Coleman 18:17, 5 марта 2026

GB200 NVL72 от NVIDIA устанавливает новый рекорд STAC-AI для вывода LLM в финансовой торговле, обеспечивая до 3,2-кратную производительность по сравнению с архитектурой Hopper.

NVIDIA Blackwell разбивает финансовый ИИ-бенчмарк с увеличением скорости в 3,2 раза

Архитектура Blackwell от NVIDIA только что показала самые быстрые результаты на бенчмарке STAC-AI для финансового вывода LLM, при этом GB200 NVL72 обеспечивает до 3,2-кратного улучшения производительности одного GPU по сравнению с предыдущим поколением Hopper. Результаты от 5 марта 2026 года имеют значение для торговых фирм, стремящихся извлечь альфу из анализа неструктурированных данных.

Центр стратегического технологического анализа, который тестирует рабочие нагрузки финансовых технологий более 15 лет, протестировал Blackwell в реальных сценариях, используя документы EDGAR 10-K — плотные годовые отчеты, которые количественные фонды анализируют для инвестиционных сигналов. Работая с моделями Llama 3.1 от Meta, GB200 NVL72 достиг 37 480 слов в секунду на финансовых запросах средней длины по сравнению с 8 237 WPS для двойных систем GH200.

Чистые цифры рассказывают историю

На модели Llama 3.1 8B с данными EDGAR4 Blackwell обработал 224 запроса в секунду против 51,5 RPS для Hopper — улучшение в 4,3 раза на уровне системы. Разрыв увеличился на вычислительно более тяжелых задачах: модель с параметром 70B на длинноконтекстных документах EDGAR5 показала скачок пропускной способности с 41,4 WPS до 150 WPS.

Что делает эти улучшения возможными? Новый формат квантования NVFP4 от NVIDIA, эксклюзивный для Blackwell, сжимает модели в меньший объем памяти без ущерба для точности. Hopper использовал квантование FP8; архитектурный скачок к четырехбитной точности на Blackwell открывает дельту пропускной способности.

Интерактивная производительность имеет значение для торговли

Пакетная обработка — это одно. Торговые решения в реальном времени требуют быстрых ответов. Здесь Blackwell поддерживал более низкое время реакции (аналогично времени до первого токена) и лучшую задержку между словами даже при максимальной пропускной способности. При одинаковых уровнях использования GB200 NVL72 стабильно превосходил GH200 по показателям отзывчивости в большинстве тестовых сценариев.

Для торговых отделов, выполняющих анализ настроений по отчетам о прибыли или анализирующих срочные новости, это преимущество в задержке напрямую переводится в более быстрое принятие решений. Бенчмарк явно тестировал полный конвейер вывода, включая токенизацию — работу, которую реальные развертывания не могут пропустить.

Рыночный контекст

Акции NVIDIA торговались по 181,41$ 5 марта, вырос на 1,1% за день, при этом рыночная капитализация компании составляет 4,42 триллиона$. Архитектура Blackwell, анонсированная на GTC 2024, была специально разработана для генеративных рабочих нагрузок ИИ. Генеральный директор Дженсен Хуанг позиционировал ее как питающую "новую промышленную революцию", и эти результаты бенчмарка предоставляют конкретные доказательства этого утверждения в финансовом секторе.

Суперчип GB200 Grace Blackwell объединяет два GPU B200 с процессором Grace, оснащенный переработанными ядрами AI Tensor и NVLink пятого поколения для масштабирования до 576 GPU. Предыдущие результаты MLPerf показали 2,2-кратное увеличение обучения на Llama 3.1 405B; эти цифры STAC-AI подтверждают, что аналогичные преимущества распространяются на вывод.

Hopper все еще актуален

Стоит отметить: трехлетняя архитектура Hopper показала достойные цифры. Торговые фирмы с существующими развертываниями GH200 не устаревают за одну ночь. Но для новых сборок или фирм, где скорость вывода напрямую влияет на доходность, экономика Blackwell выглядит убедительно — NVIDIA заявляет о снижении эксплуатационных расходов на вывод LLM до 25 раз по сравнению с предыдущими поколениями.

Полные отчеты STAC, включая подробные показатели интерактивного режима по различным скоростям поступления, доступны через официальные каналы STAC. Финансовые учреждения, оценивающие обновления инфраструктуры ИИ, теперь имеют проверенные данные сторонних платформ для принятия решений о закупках.

Источник изображения: Shutterstock
  • nvidia
  • blackwell
  • вывод ИИ
  • финансовая торговля
  • llm
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

30 000$ в PRL + 15 000 USDT

30 000$ в PRL + 15 000 USDT30 000$ в PRL + 15 000 USDT

Вносите депозит и торгуйте PRL для роста наград!