NVIDIA представляє Vera Rubin POD — суперкомп'ютер ШІ з 40 стійками для агентних робочих навантажень
Iris Coleman 19:48, 16 березня 2026
NVIDIA оголошує про Vera Rubin POD з 1 152 графічними процесорами у 40 стійках, що забезпечує 60 ексафлопс і в 10 разів кращу продуктивність виведення на ват порівняно з Blackwell.
NVIDIA щойно оприлюднила специфікації свого найамбітнішого проєкту інфраструктури ШІ. Vera Rubin POD містить 1 152 графічні процесори Rubin у 40 стійках, забезпечуючи 60 ексафлопс обчислювальної потужності та 10 петабайт на секунду загальної пропускної здатності масштабування. Серійні установки почнуть постачатися у другій половині 2026 року.
Цифри тут вражають: 1,2 квадрильйона транзисторів, майже 20 000 чіпів NVIDIA, усі розроблені для функціонування як єдиний когерентний суперкомп'ютер. NVIDIA стверджує про в 4 рази кращу продуктивність навчання та в 10 разів кращу продуктивність виведення на ват порівняно з поточною архітектурою Blackwell — при цьому вартість токенів знижується до однієї десятої від поточного рівня.
П'ять спеціально створених стійкових систем
POD поєднує п'ять різних систем масштабу стійки, кожна з яких націлена на конкретні вузькі місця в сучасних робочих навантаженнях ШІ:
Vera Rubin NVL72 служить основним обчислювальним двигуном. Кожна стійка інтегрує 72 графічні процесори Rubin і 36 процесорів Vera CPU, з'єднаних через NVLink 6, що забезпечує пропускну здатність 3,6 ТБ/с на графічний процесор — більше загальної пропускної здатності, ніж увесь глобальний інтернет, за даними NVIDIA. Система націлена на всі чотири закони масштабування ШІ: попереднє навчання, післянавчання, масштабування часу тестування та агентне масштабування.
Стійки Groq 3 LPX вирішують проблему затримки. З 256 мовними процесорними блоками на стійку, що використовують архітектуру лише з SRAM, вони працюють у парі з NVL72 для забезпечення, як стверджує NVIDIA, в 35 разів більше токенів і в 10 разів більше можливостей отримання доходу для моделей з трильйоном параметрів порівняно з Blackwell.
Стійки Vera CPU забезпечують ізольовані середовища для тестування агентів. Одна стійка підтримує понад 22 500 одночасних середовищ навчання з підкріпленням — критично важливих для перевірки результатів агентного ШІ перед розгортанням.
Стійки BlueField-4 STX представляють те, що NVIDIA називає «рідним для ШІ сховищем» через платформу контекстної пам'яті CMX. Завдяки перенесенню кешу KV на виділене високошвидкісне сховище система забезпечує в 5 разів більше токенів за секунду та в 5 разів кращу енергоефективність порівняно з традиційними підходами.
Мережеві стійки Spectrum-6 SPX об'єднують усе разом за допомогою комутаторів 102,4 Тбіт/с зі спільно упакованою оптикою.
Аргумент економіки токенів
NVIDIA формулює це навколо конкретної ринкової реальності: споживання токенів зараз перевищує 10 квадрильйонів щорічно, і перехід від взаємодії людина-ШІ до взаємодії ШІ-ШІ значно прискорить це зростання. Сучасні агентні системи генерують величезні обсяги токенів міркування, розширюючи при цьому вимоги до кешу KV — саме вузьке місце, на яке націлена ця архітектура.
Сторонні тести SemiAnalysis InferenceMax, на які посилається NVIDIA, показують, що поточні системи Blackwell вже забезпечують у 50 разів кращу продуктивність на ват і в 35 разів нижчу вартість на токен порівняно з H200. Vera Rubin має на меті розширити цю перевагу.
Теплова та енергетична інженерія
Архітектура стійки MGX третього покоління впроваджує інтелектуальне згладжування живлення з у 6 разів більшим накопиченням енергії на рівні стійки (400 джоулів на графічний процесор), ніж у попередніх поколіннях. Це зменшує пікові потреби в струмі до 25% і усуває потребу в масивних акумуляторних батареях.
Усі стійки працюють при температурі вхідної теплої води 45°C, що дозволяє центрам обробки даних у багатьох кліматичних зонах використовувати охолодження навколишнім повітрям. NVIDIA стверджує, що це вивільняє достатньо енергії для додавання на 10% більше стійок у тому самому енергетичному бюджеті об'єкта.
Погляд у майбутнє
Окрім початкової конфігурації POD, NVIDIA представила Vera Rubin Ultra NVL576 з масштабуванням до 576 графічних процесорів у восьми стійках і архітектуру наступного покоління Kyber, орієнтовану на NVL1152 зі 144 графічними процесорами на стійку. Дорожня карта свідчить про те, що NVIDIA бачить багатостійкові домени NVLink як майбутнє інфраструктури ШІ — не просто більші графічні процесори, а принципово інші системні архітектури.
Для підприємств, що планують інвестиції в інфраструктуру ШІ, повідомлення є чітким: економіка обчислень ШІ переміщується від оптимізації на рівні чіпів до оптимізації на рівні об'єктів. Ті, хто зараз будує центри обробки даних, стикаються з вибором між системами поточного покоління та очікуванням доступності Vera Rubin наприкінці 2026 року.
Джерело зображення: Shutterstock- nvidia
- інфраструктура ШІ
- vera rubin
- центри обробки даних
- корпоративний ШІ



