Мужчину насмерть придавило КамАЗом на севере Москвы

Для всех, кто хранит дома купюры 5 000 рублей - важное изменение в декабре

Замглавы академии Вешкину предъявили обвинение в получении взятки в крупном размере

В Гидрометцентре спрогнозировали похолодание и гололедицу в Москве 3 января

Китайская компания создала передовую модель искусственного интеллекта, которая потребляет в 11 раз меньше вычислительных ресурсов, чем ее конкуренты

28.12.2024 08:39

Эта информация говорит о том, что, хотя санкции США повлияли на доступность оборудования для ИИ в Китае, учёные работают над тем, чтобы извлечь максимальную производительность из ограниченного количества оборудования и уменьшить влияние сокращения поставок чипов для ИИ в Китай.
Компания опубликовала модель и весовые коэффициенты в открытом доступе, тестирование начнётся в ближайшее время.

Компания Deepseek всего за два месяца обучила свою языковую модель DeepSeek-V3 Mixture-of-Experts (MoE) с 671 миллиардом параметров с помощью кластера, состоящего из 2048 графических процессоров Nvidia H800, что составляет 2,8 миллиона часов работы графических процессоров. Для сравнения: Meta потребовалось в 11 раз больше вычислительной мощности (30,8 млн часов работы графических процессоров) для обучения Llama 3 с 405 миллиардами параметров с помощью кластера, состоящего из 16 384 графических процессоров H100, в течение 54 дней.

DeepSeek утверждает, что значительно снизила требования к вычислительным мощностям и памяти, которые обычно требуются для моделей такого масштаба, с помощью передовых конвейерных алгоритмов, оптимизированной системы коммуникации и вычислений с низкой точностью FP8.

Компания использовала кластер из 2048 графических процессоров Nvidia H800, каждый из которых был оснащён межсоединением NVLink для связи между графическими процессорами и межсоединением InfiniBand для связи между узлами. В таких системах связь между графическими процессорами довольно быстрая, а связь между узлами — нет, поэтому оптимизация является ключом к повышению производительности и эффективности. Хотя DeepSeek внедрила десятки методов оптимизации для снижения вычислительных требований DeepSeek-v3, несколько ключевых технологий позволили добиться впечатляющих результатов.

Сообщение Китайская компания создала передовую модель искусственного интеллекта, которая потребляет в 11 раз меньше вычислительных ресурсов, чем ее конкуренты появились сначала на Время электроники.

Главные новости дня, 2 января 2025 года

Около 2,4 тысячи тонн мазута вытекло в Черное море после крушения танкеров

"ИИСУС ИЗ УСБ": СЕНСАЦИЯ: "Z" и "АЗ" В НЕЙРО ОРУДИЯХ СВО. МНОГО НАТО НЕ НАДО ХОРОШИМ ДРУЗЬЯМ! СЕНСАЦИОННЫЕ ВАЖНЫЕ НОВОСТИ! Россия, США, Европа могут улучшить отношения и здоровье общества?!

Умерла Инна Выходцева, сыгравшая в «Служебном романе» и «Москва слезам не верит»

"Спартак" хочет продлить Руслана Литвинова?

Врач Михаил Кутушов рассказал, как избежать проблем с перееданием в Новый год

Про маньяков, Жириновского и моделей: топ-5 самых ожидаемых сериалов 2025 года

BN: сделка Путина с Индией на 13 млрд долларов нанесла удар по Западу

Замглавы академии Вешкину предъявили обвинение в получении взятки в крупном размере

В Гидрометцентре спрогнозировали похолодание и гололедицу в Москве 3 января

Около 2,4 тысячи тонн мазута вытекло в Черное море после крушения танкеров

Директор Чигирев назвал вбросом возвращение певца Леонтьева на большую сцену

Никогда не понимала тех, у кого портится тыква. Показываю, какой вкусный десерт в духовке я из неё готовлю

Подкаст "Женское дело. Лаборатория успеха". В гостях Ксения Подхватиловская

Что опытные дачники добавляют в воду для полива декабриста: растение укроется одеялом из цветов

Carolina Herrera pre-fall 2025

"Уехала в США, родила от друга принца Уильяма и принца Гарри". Как сложилась судьба Марии Шараповой

Брисбен (ATP). 1/4 финала. Джокович сыграет с Опелкой. Димитров – с Томпсоном

Касаткина выходит в третий круг WTA-500 в Брисбене после трёхчасовой борьбы

Капризов стал лучшим снайпером года в НХЛ, Кудерметова прошла Касаткину. Главное к утру

Пенсионеры назвали самые любимые направления в новогодние праздники

Врач рассказала, почему появляется седина и можно ли остановить этот процесс

Окно в прошлый век

Около 2,4 тысячи тонн мазута вытекло в Черное море после крушения танкеров

В Гидрометцентре спрогнозировали похолодание и гололедицу в Москве 3 января

Замглавы академии Вешкину предъявили обвинение в получении взятки в крупном размере

Глава ФТР Тарпищев заявил, что "Спартаку" нужно усилить центр защиты

Мужчину насмерть придавило КамАЗом на севере Москвы

Для всех, кто хранит дома купюры 5 000 рублей - важное изменение в декабре

Замглавы академии Вешкину предъявили обвинение в получении взятки в крупном размере

В Гидрометцентре спрогнозировали похолодание и гололедицу в Москве 3 января

Китайская компания создала передовую модель искусственного интеллекта, которая потребляет в 11 раз меньше вычислительных ресурсов, чем ее конкуренты

Читайте на 123ru.net

Разное на 123ru.net

Game24.pro

Работа

Настроение

Частные объявления в Вашем городе, в Вашем регионе и в России

Новости от наших партнёров в Вашем городе

Главные новости дня, 2 января 2025 года

Около 2,4 тысячи тонн мазута вытекло в Черное море после крушения танкеров

Умерла Инна Выходцева, сыгравшая в «Служебном романе» и «Москва слезам не верит»

"Спартак" хочет продлить Руслана Литвинова?

Врач Михаил Кутушов рассказал, как избежать проблем с перееданием в Новый год

Про маньяков, Жириновского и моделей: топ-5 самых ожидаемых сериалов 2025 года

BN: сделка Путина с Индией на 13 млрд долларов нанесла удар по Западу

Замглавы академии Вешкину предъявили обвинение в получении взятки в крупном размере

В Гидрометцентре спрогнозировали похолодание и гололедицу в Москве 3 января

Около 2,4 тысячи тонн мазута вытекло в Черное море после крушения танкеров

Директор Чигирев назвал вбросом возвращение певца Леонтьева на большую сцену

Никогда не понимала тех, у кого портится тыква. Показываю, какой вкусный десерт в духовке я из неё готовлю

Подкаст "Женское дело. Лаборатория успеха". В гостях Ксения Подхватиловская

Что опытные дачники добавляют в воду для полива декабриста: растение укроется одеялом из цветов

Carolina Herrera pre-fall 2025

"Уехала в США, родила от друга принца Уильяма и принца Гарри". Как сложилась судьба Марии Шараповой

Брисбен (ATP). 1/4 финала. Джокович сыграет с Опелкой. Димитров – с Томпсоном

Касаткина выходит в третий круг WTA-500 в Брисбене после трёхчасовой борьбы

Капризов стал лучшим снайпером года в НХЛ, Кудерметова прошла Касаткину. Главное к утру

Пенсионеры назвали самые любимые направления в новогодние праздники

Врач рассказала, почему появляется седина и можно ли остановить этот процесс

Окно в прошлый век

31.12.2024

Топ новостей на этот час

Около 2,4 тысячи тонн мазута вытекло в Черное море после крушения танкеров

В Гидрометцентре спрогнозировали похолодание и гололедицу в Москве 3 января

Замглавы академии Вешкину предъявили обвинение в получении взятки в крупном размере

Глава ФТР Тарпищев заявил, что "Спартаку" нужно усилить центр защиты