Сравнение AMD MI350 и Nvidia: память против сетевых возможностей

AMD представляет новые ускорители Instinct MI350X и MI355X на архитектуре CDNA 4, сделанные по 3-нм техпроцессу TSMC. Каждый чип содержит до 185 миллиардов транзисторов и работает с памятью HBM3E объёмом 288 ГБ, что важно для ИИ-задач.

У MI350X воздушное охлаждение и потребление 1000 ватт, у MI355X — 1400 ватт, поддержка воздушного и жидкостного охлаждения. Реальная производительность MI355X, по оценке SemiAnalysis, будет выше MI350X примерно на 10%.

По данным SemiAnalysis, MI355X способен конкурировать с Nvidia HGX B200 по эффективности затрат для некоторых задач, особенно при работе с небольшими и средними языковыми моделями. AMD заявляет, что MI355X предлагает на 60% больше памяти и более чем вдвое выше производительность FP6, чем Nvidia B200. Однако в расчетах FP4 MI355X уступает Nvidia B300, который быстрее на 30%.

Несмотря на потенциал, MI355X проигрывает Nvidia GB200 NVL72 при обучении больших моделей и масштабируемости. Только 8 чипов MI355X могут обмениваться данными на полной скорости, тогда как у Nvidia эта цифра – 72. Это сильно замедляет сложные задачи: такие задачи могут выполняться минимум в 18 раз медленнее на AMD, согласно SemiAnalysis.

Критика касается и rack-scale-решения AMD: в «стойке» из 128 GPU на самом деле размещено 16 отдельных серверов по 8 GPU, а не единая система. AMD увеличила скорость обмена данными внутри кластера до 76,8 ГБ/с, но у Nvidia скорость все еще выше в 1,6 раза.

Важную роль играет программное обеспечение. В ROCm 7 AMD заявляет о 3,5-кратном ускорении ИИ-приложений и лучшей поддержке Triton. Тем не менее, библиотека RCCL (аналоги NCCL Nvidia) остаётся слабым местом.

AMD расширяет сотрудничество с облачными площадками и развивает «AMD Developer Cloud» — вычисления на MI300X доступны от $1,99 в час. Спрос на новые чипы есть у крупных игроков: AWS собирается закупить крупную партию AMD GPU, Meta* тестирует обучение моделей на AMD, Oracle планирует установить 30 000 ускорителей MI355X, а Microsoft рассматривает возможность использования MI355 и разрабатывает планы для MI400.

Серия MI400 ожидается во второй половине 2026 года, это будет решение с объединёнными стойками и связью UALink over Ethernet, аналогичной Nvidia NVLink. SemiAnalysis сомневается, что по производительности это сравняется с решениями Nvidia. К концу 2027 года планируется MI500 UAL256 на 256 чипах. Заказать MI350 можно уже сейчас, массовые поставки стартуют в третьем квартале 2025 года.

Источник

*Meta — запрещенная в РФ организация.

Оцените статью
Gimal-Ai