Добавить новость

Mash: Анна Седокова может стать фигурантом дела об убийстве бывшего мужа

Открываем сезон кросса 2025!

В Москве прошла встреча шахматиста Мурзина

За аморалку. Конькобежка Стенина открыла, как ее с мужем арестовали в США

Блог сайта «Хайтек+»


Новости сегодня

Новости от TheMoneytizer

NVIDIA готовит ускорители GB300: больше памяти, выше производительность

Компания выпустила вычислительный кристалл B300 (ранее упоминавшийся как Blackwell Ultra) на базе кастомного техпроцесса TSMC 4NP. Он обеспечивает примерно на 50 % больше FLOPS, чем его предшественник B200, при общем увеличении TDP до 1,4 кВт у GB300 и 1,2 кВт у B300 HGX. Специалисты полагают, что часть роста производительности достигается за счёт более высоких рабочих мощностей, а оставшийся прирост вызван архитектурными изменениями и новыми способами динамически распределять мощность между CPU и GPU.

Ускорители B300 оснащают памятью HBM3E в конфигурации 12-Hi вместо прежних 8-Hi, благодаря чему общий объём вырос до 288 Гбайт. Пропускная способность памяти по-прежнему сохраняется на уровне 8 Тбайт/с, поскольку скорость на контакт не изменилась. При этом инженеры делают ставку на то, что дополнительная ёмкость памяти даёт заметное преимущество в обучении и инференсе больших языковых моделей, где размер обрабатываемых последовательностей и объём KVCache напрямую влияют на скорость генерации ответов.

Опыт с обновлением H100 до H200 показывает, насколько сильно память влияет на итоговую производительность. Более высокая пропускная способность, которую раньше подняли с 3,35 Тбайт/с до 4,8 Тбайт/с, ускорила интерактивный инференс почти на 43 %. Дополнительное пространство в памяти помогло сократить объём передаваемых данных и увеличить допустимый размер KVCache, увеличивая количество генерируемых токенов в секунду втрое. По сообщениям экспертов, такая оптимизация особенно полезна для более «продвинутых» моделей, способных приносить более высокую прибыль от каждого ускорителя.

Однако одних улучшений скорости и памяти недостаточно, что подтверждают попытки AMD с Instinct MI300X, MI325X и MI355X (от 192 до 288 Гбайт). Аналитики отмечают, что их возможности ограничены не столько ПО, сколько спецификой соединения ускорителей между собой. NVIDIA предлагает коммутацию «все ко всем» через NVLink, позволяя 72 GB200 или GB300 ускорителям обрабатывать одну и ту же задачу, снижать задержку для крупных языковых моделей и при этом сохранять экономическую целесообразность.

Исследователи предполагают, что только NVL72 даёт возможность расширять длину инференса до более чем 100 тысяч токенов без критичного роста стоимости. По словам https://semianalysis.com/2024/12/25/nvidias-christmas-presen... , это значит, что NVIDIA пока остаётся единственным поставщиком комплексных решений, способных удовлетворить запросы на реализацию больших языковых моделей, сохраняя при этом высокую скорость, масштабируемость и экономическую выгоду.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Не успели спасти: на борту самолёта из Москвы в Ереван скончался пассажир

Собянин: Более 1 тысячи тонн продукции куплено на рынках «Москва — на волне»

Мощный звездопад могут увидеть жители Карелии в ночь с 3 на 4 января

Противоопухолевый препарат на основе клеток-киллеров создали в Белоруссии

Музыкальные новости

Кабинет Артиста в Яндекс. Кабинет Артиста в Яндекс Музыке. Личный кабинет Артиста в Яндекс Музыке.

Сергей Собянин. Главное за день

Московское «Динамо» прервало серию поражений, разгромив «Северсталь»

Создание Модели голоса. Создание Модели своего голоса.

Новости России

«Возбудили уголовное дело». Анне Седоковой из Риги грозят Интерполом

Начинали у Тарковского и Михалкова. Юные звезды, которые стали актерами

Открываем сезон кросса 2025!

В ночь с 3 на 4 января можно увидеть первый звездопад 2025 года

Экология в России и мире

Рэпер Моргенштерн возьмет перерыв в карьере ради лечения

Предлагаем вам возможность участвовать в записи программ на Радио.

Carolina Herrera pre-fall 2025

В 2024 году министры здравоохранения сменились в 27 регионах

Спорт в России и мире

Русские теннисистки Андреева и Шнайдер выходят в финал WTA в Брисбене

Астана? Бублик назвал город, в котором будет жить после завершения карьеры

Капризов стал лучшим снайпером года в НХЛ, Кудерметова прошла Касаткину. Главное к утру

Рублёв выпадет из топ-8 после поражения на турнире ATP в Гонконге

Moscow.media

Создание Модели голоса. Создание Модели своего голоса. Создание AI модели голоса.

Продвижение Песни в Мою Волну музыкального стриминга Яндекс Музыка.

Поезд Деда Мороза – встречаем в столицах! (видео)

ИИ начнет продавать ваши решения до их совершения, предупредили эксперты











Топ новостей на этот час

Rss.plus






По делу о подготовке теракта: что известно об аресте замначальника инспекции РЖД

Малайская медведица Маша в Московском зоопарке: уникальная встреча с гостями

Открываем сезон кросса 2025!

Трамп заявил, что его инаугурация может пройти с приспущенными флагами