В этом квартале NVIDIA планирует увеличивать поставки ускорителей Blackwell. В прошлом месяце компания объявила , что производство графических процессоров Blackwell запущено в полном объеме. Однако теперь Reuters и The Informant сообщают о возможных проблемах, связанных с перегревом этих ускорителей.
Проблемы, по-видимому, затрагивают серверы в формате полной стойки GB200 NVL72. Это полноценный сервер с 36 процессорами Grace CPU и 72 графическими процессорами Blackwell, все они расположены в одной стойке и связаны между собой через NVLink. Потребляемая мощность такой системы составляет 120 кВт, поэтому ее полностью охлаждают водой. У 36 вычислительных модулей GB200 Grace Blackwell Superchip TDP можно настраивать до 2.700 Вт. Только эти модули потребляют 97,2 кВт — остальные 20 кВт приходятся на коммутаторы NVLink для межсоединений и сетевые коммутаторы для связи вне стойки.
С выпуском GB200 NVL72 ...