Nvidia расширила платформу Vera Rubin для ИИ

Nvidia на конференции GTC 2026 расширила платформу Vera Rubin, которую впервые показала на CES 2026. Компания добавила новые серверные стойки с собственными CPU, отдельные чипы для инференса, новую архитектуру хранения, операционную систему для инференса, альянсы вокруг открытых моделей и ПО для защиты ИИ-агентов.

Теперь платформа включает семь чипов и пять типов стоек, объединённых в то, что Nvidia называет Vera Rubin POD. В эту конфигурацию входят 40 стоек, 1,2 квадриллиона транзисторов, почти 20 тысяч кристаллов Nvidia, 1 152 GPU Rubin, 60 экзафлопс вычислительной мощности и 10 ПБ/с пропускной способности для масштабирования внутри системы.

Базовым вычислительным блоком стала стойка Vera Rubin NVL72. Она объединяет 72 GPU Rubin, 36 CPU Vera, сетевые адаптеры ConnectX-9 SuperNIC и DPU BlueField-4 в 18 вычислительных лотках и 9 лотках с коммутаторами NVLink. По данным Nvidia, одна стойка шириной 19 дюймов содержит 1,3 млн компонентов, около 1 300 чипов и весит примерно 4 000 фунтов.

Nvidia заявляет о росте производительности до 4 раз в обучении и до 10 раз в инференсе на ватт по сравнению с Blackwell. NVLink шестого поколения даёт 3,6 ТБ/с на один GPU и 260 ТБ/с на всю стойку. Основа соединений — четыре модульных картриджа с 5 000 медных кабелей общей длиной более двух миль.

Генеральный директор Jensen Huang отдельно отметил упрощение сборки. По его словам, вычислительные лотки полностью лишены кабелей, шлангов и вентиляторов, а печатная плата midplane заменяет обычную кабельную схему. Nvidia утверждает, что это снижает время сборки одного лотка почти с двух часов до пяти минут.

Выше NVL72 компания представила ещё два уровня масштабирования. Vera Rubin Ultra NVL576 использует новую двухслойную топологию all-to-all NVLink и объединяет восемь стоек NVL72, каждая из которых содержит 72 GPU Rubin Ultra, в единый домен NVLink на 576 GPU через медные и прямые оптические соединения. Nvidia также сообщила, что уже собрала рабочий прототип Polyphe на базе более ранней архитектуры GB200.

Ещё одной новинкой стала стойка Kyber, которая увеличивает размер NVLink-домена до 144 GPU на стойку. Вместо горизонтальных серверных лотков в ней используются вертикальные слои: спереди вычислительные модули с четырьмя GPU Rubin Ultra и двумя CPU Vera, за ними midplane, а сзади — NVLink backplane. Nvidia считает, что такая схема без кабелей заметно ускоряет установку. Восемь стоек Kyber образуют конфигурацию NVL1152 с 1 152 GPU.

По данным компании, один Rubin Ultra выдаёт 100 петафлопс в формате FP4. GPU состоит из четырёх вычислительных кристаллов вместо двух, каждый площадью более 800 кв. мм, и оснащён 16 стеками памяти HBM4e общим объёмом 1 ТБ. Полная система NVL144 Kyber, по данным Nvidia, достигает 15 экзафлопс FP4.

Отдельно Nvidia показала стойку с CPU Vera. Она включает 256 процессоров Vera, жидкостное охлаждение, 64 DPU BlueField-4, более 22 500 ядер и 400 ТБ памяти. Компания утверждает, что одна стойка может поддерживать более 22 500 параллельных сред для reinforcement learning или песочниц для агентов.

Nvidia поясняет, что ИИ-агенты работают не только на GPU. Вызовы инструментов, SQL-запросы, компиляция и выполнение в изолированных средах требуют CPU. Сам процессор Vera, по данным компании, получил 88 Arm-ядер Olympus, память LPDDR5X с пропускной способностью до 1,2 ТБ/с и интерфейс NVLink C2C для прямого соединения с GPU Rubin.

Одной из самых заметных новинок стала Groq 3 LPX — выделенная платформа для инференса. Это первый случай, когда Nvidia выводит отдельный конвейер для таких задач. Стойка содержит 32 вычислительных лотка, в каждом по восемь LPU, соединённых прямой межчиповой шиной из тысяч парных медных соединений. Несколько стоек LPX можно объединять в единый инференс-движок.

Эти LPU рассчитаны на генерацию токенов с низкой задержкой и меньшими затратами. Nvidia утверждает, что в связке с NVL72 система даёт до 35 раз больше токенов и до 10 раз больше выручки для моделей с триллионом параметров по сравнению с Blackwell. Поставки намечены на вторую половину года.

Компания также анонсировала платформу CMX на базе BlueField-4 STX. Она выносит KV-кэш в отдельный слой хранения с высокой пропускной способностью. KV-кэш — это буфер, где языковая модель держит промежуточные результаты диалога, чтобы не пересчитывать их заново при каждом новом токене. Чем длиннее диалог или цепочка действий агента, тем больше памяти занимает такой кэш.

Согласно техническому блогу Nvidia, CMX рассматривает этот временный контекст инференса как повторно используемый тип данных для ИИ. Его можно передавать между репликами, целыми сессиями и разными агентами. Nvidia заявляет о росте пропускной способности по токенам в 5 раз и таком же улучшении энергоэффективности по сравнению с обычными подходами к хранению.

Над этим уровнем работает Dynamo 1.0 — открытая операционная система для инференса, которая распределяет ресурсы GPU и памяти по кластеру. Nvidia интегрирует её в LangChain, SGLang и vLLM. По данным компании, Dynamo уже поддерживают AWS, Azure, Google Cloud, Oracle, CoreWeave, Together AI, Nebius, Cursor, Perplexity и Pinterest.

Сетевые стойки Spectrum-6 SPX объединяют весь POD в единый суперкомпьютер. Новый коммутатор Spectrum-6 обеспечивает 102,4 Тбит/с через 512 линий по 200 Гбит/с и использует co-packaged optics, встроенную прямо в чип. Nvidia заменяет традиционные сменные трансиверы встроенной кремниевой фотоникой, что должно снизить задержку и повысить энергоэффективность.

Механической основой для всех пяти типов стоек стала архитектура MGX третьего поколения. По словам Nvidia, стойки NVL и ETL используют общую физическую инфраструктуру: корпуса, лотки, кабельные картриджи, жидкостные коллекторы, шины питания и другие элементы. Все стойки рассчитаны на подачу тёплой воды температурой 45 градусов Цельсия и полностью используют жидкостное охлаждение.

Компания также представила систему Intelligent Power Smoothing. В ней используются конденсаторы с шестикратным ростом запаса энергии по сравнению с прошлым поколением — 400 джоулей на GPU. Это снижает пиковые токовые нагрузки до 25 процентов. Технология Dynamic Max-Q, по заявлению Nvidia, позволяет распределять питание между стойками по типу нагрузки и размещать до 30 процентов больше GPU в том же энергобюджете.

Nvidia сообщила, что передала дизайн GB200 NVL72 в Open Compute Project. По данным компании, в экосистеме производства и поставок таких стоек участвуют более 80 партнёров.

С помощью референс-дизайна DSX и системы DSX Air компания расширяет предложение до проектирования и эксплуатации целых площадок. DSX объединяет вычисления, сеть, хранение, питание и охлаждение в единую схему для ИИ-фабрик, а DSX Air превращает её в цифровой двойник объекта до поставки оборудования. По словам Nvidia, CoreWeave, Siam.AI и Hydra Host уже используют такие симуляции, чтобы сократить время до первого рабочего токена.

В части моделей Nvidia создаёт Nemotron Coalition — альянс с Black Forest Labs, Cursor, LangChain, Mistral AI, Perplexity, Reflection AI, Sarvam и Thinking Machines Lab. Цель — совместно разрабатывать открытые frontier-модели, доступные без закрытых интерфейсов. Nvidia предоставляет для этого вычисления DGX Cloud, но объём ресурсов не раскрывает. Первую модель совместно создадут Mistral AI и Nvidia, а затем она станет базой для семейства Nemotron 4.

Компания также расширяет семейства моделей Nemotron для агентных систем, Cosmos и Isaac GR00T для робототехники и автономного транспорта, а также BioNeMo, Proteina Complexa и nvQSP для биотехнологий и разработки лекарств.

Для безопасного запуска таких моделей в рабочих агентных приложениях Nvidia представила NemoClaw. Huang показал платформу на своей keynote-презентации и сравнил OpenClaw с прежними инфраструктурными стандартами: «OpenClaw gave us, gave the industry exactly what it needed at exactly the time. Just as Linux gave the industry exactly what it needed at exactly the time, just as Kubernetes showed up at exactly the right time, just as HTML showed up». По словам Huang, сегодня каждой компании нужна стратегия OpenClaw: «For the CEOs, the question is, what’s your OpenClaw strategy?»

NemoClaw не является копией открытого фреймворка OpenClaw от Nvidia. Это версия с дополнительными защитными ограничениями. OpenClaw даёт базовые блоки для ИИ-агентов: runtime, память и повторно используемые навыки. NemoClaw добавляет слой безопасности и приватности через Nvidia Agent Toolkit и OpenShell, который управляет доступными действиями агента и доступом к данным. Nvidia разработала NemoClaw вместе с создателем OpenClaw Питером Штайнбергером.

Сама Nvidia называет NemoClaw ранней alpha-версией. В описании сказано: «Expect rough edges. We are building toward production-ready sandbox orchestration, but the starting point is getting your own environment up and running».

На GTC Nvidia также объявила о партнёрстве с Adobe. По данным компании, Adobe планирует интегрировать Firefly, Firefly Foundry, Acrobat, Frame.io и новое облачное решение для 3D-цифровых двойников в маркетинге с CUDA X, NeMo, Cosmos, Agent Toolkit и Omniverse.

Ещё одна новинка — вычислительные модули для космоса. Модуль Space-1 Vera Rubin вместе с IGX Thor и Jetson Orin должен обеспечить обработку ИИ-нагрузок на орбите. В списке пользователей Nvidia называет Aetherflux, Axiom Space, Kepler, Planet, Sophia Space и Starcloud. По данным компании, Rubin-модуль даёт до 25 раз больше вычислений для орбитального инференса, чем H100.

Отдельно Nvidia анонсировала DLSS 5. Это технология нейронного рендеринга, которая выйдет осенью 2026 года для серии RTX 50. В отличие от прошлых версий DLSS, она отвечает не за апскейлинг и не за генерацию кадров, а добавляет ИИ-слой освещения с более фотореалистичным светом, тенями и поведением материалов. Nvidia называет это самым крупным скачком в графике со времён трассировки лучей в реальном времени.

Согласно практическому отчёту Digital Foundry, DLSS 5 использует только цветовую информацию и векторы движения из игрового движка. Нейросеть распознаёт типы поверхностей — кожу, волосы, воду, металл — и обрабатывает их по-разному. Геометрия, текстуры и материалы, по словам Nvidia, не меняются. Digital Foundry протестировала технологию в Resident Evil Requiem, Hogwarts Legacy, Assassin’s Creed Shadows, Oblivion Remastered и Starfield, назвав результат для окружения, материалов и растительности «astonishing».

При этом у демонстрации есть важное ограничение. Она работала на двух RTX 5090: одна видеокарта запускала игру, вторая отдельно обрабатывала DLSS 5. Nvidia утверждает, что финальная версия будет работать на одном GPU, но признаёт, что для этого ещё нужна серьёзная оптимизация и доработка по VRAM. Digital Foundry уже заметила часть визуальных ошибок и назвала текущее состояние «snapshot».

Реакция игрового сообщества оказалась заметно более критичной, чем оценка Nvidia. Многие пользователи пишут, что изменённые лица выглядят как типовой ИИ-фильтр и разрушают художественный замысел разработчиков. Digital Foundry также отмечает, что пока остаётся открытым вопрос, нужен ли игрокам и студиям именно такой вариант фотореализма. Nvidia отвечает, что разработчики получат инструменты настройки, а сама функция останется опциональной.

Источник: The Decoder, Nvidia, Digital Foundry.

Оцените статью
Gimal-Ai