Nvidia представила компактную систему DGX Spark, которая, как заявляет компания, является «самым маленьким ИИ-суперкомпьютером в мире». Стоимость устройства — около $4000. Spark предназначен не для геймеров, а для разработчиков, исследователей и компаний, которые хотят обучать крупные модели на месте без использования облака. Первые обзоры дают смешанные оценки.
DGX Spark похож на уменьшенную копию крупных систем Nvidia DGX и повторяет их дизайн. Генеральный директор Nvidia Дженсен Хуанг символически вручил первый экземпляр Илону Маску — в память о том, как в 2016 он передавал оригинальный DGX-1 в OpenAI.
В основе DGX Spark — новый чип GB10 на архитектуре Grace-Blackwell. В нем совмещены 20 ядер Arm (10 Cortex‑X925 и 10 Cortex‑A725) и GPU Blackwell, производимый по 3-нанометровому техпроцессу TSMC. Центральный и графический процессор соединены напрямую через NVLink C2C.
Основная особенность — память: общий пул объемом 128 ГБ LPDDR5X с пропускной способностью 273 ГБ/с, доступный и CPU, и GPU. Nvidia утверждает, что это позволяет запускать локально модели до 200 миллиардов параметров для вывода (4‑бит), или примерно 70 миллиардов во время дообучения.
DGX Spark содержит 6144 CUDA-ядра, 192 тензорных ядра пятого поколения и теоретическую производительность FP4 на уровне 1 петафлопс. В комплекте: SSD на 4 ТБ, четыре порта USB‑C, HDMI, 10‑гигабитный Ethernet и два разъема QSFP56 для 200‑гигабитных сетей с поддержкой RDMA. Несколько устройств Spark можно объединять в небольшие кластеры через эти интерфейсы.
По данным The Register, DGX Spark не оптимизирован на максимальную скорость: он способен запускать крупные модели больше любой потребительской видеокарты, но делает это медленней. Дообучение Llama‑3.2 с 3 млрд параметров длилось в Spark примерно 90 секунд на миллион токенов — в два раза дольше, чем на RTX 6000 Ada, которая быстро утыкается в лимит собственной памяти (48 ГБ).
Генерация изображения с помощью FLUX.1 Dev занимала 97 секунд на Spark, против 37 секунд на RTX 6000 Ada. При этом расход электроэнергии у Spark держится на уровне 40–45 ватт в простое и примерно 200 ватт под нагрузкой, тогда как одна RTX 6000 Ada потребляет около 300 ватт.
В тестах языковых моделей Llama.cpp и TensorRT‑LLM пропускная способность составляла 14–49 токенов в секунду в зависимости от размера модели и настроек батча.
Предустановленная система DGX OS построена на Ubuntu 24.04, включает CUDA, Docker, драйверы и средства управления. Функция Nvidia Sync позволяет работать с устройством удаленно через VPN или SSH, управлять веб-интерфейсами и средами для разработки.
Основными конкурентами Nvidia будут Mac Studio на чипе M4 от Apple и ожидаемые AMD Strix Halo. Все они предлагают схожий объем памяти, но различаются программной экосистемой: у Nvidia это CUDA и свой стек ПО, у Apple — Metal, у AMD — ROCm.
The Register отмечает и внутреннего конкурента: Jetson Thor Developer Kit, тоже на архитектуре Blackwell, дает вдвое больше FP4-производительности и тоже оснащается 128 ГБ памяти примерно за ту же цену. Jetson Thor рассчитан на робототехнику и встраиваемые системы, тогда как DGX Spark создан как платформа для разработчиков.
По версии ServeTheHome, DGX Spark — «переломный момент для разработки ИИ на месте». Благодаря большому объему общей памяти и возможности объединения нескольких устройств с высокой скоростью он позволяет работать с крупными моделями без облака. Это «интересное решение для исследований, аналитики и внутренних задач», хотя не подходит для игр или мультимедиа.
The Register более сдержан: «DGX Spark не рассчитан на максимальную производительность, а создан, чтобы делать всё достаточно хорошо». Для многих пользователей именно такого баланса и достаточно.
Массовым продукт может стать только если AMD догонит по программному обеспечению. Сам чип GB10 скоро появится и в Windows‑ПК.






















