Добавить новость

Мужчину насмерть придавило КамАЗом на севере Москвы

Для всех, кто хранит дома купюры 5 000 рублей - важное изменение в декабре

Замглавы академии Вешкину предъявили обвинение в получении взятки в крупном размере

В Гидрометцентре спрогнозировали похолодание и гололедицу в Москве 3 января

«Время электроники»


Новости сегодня

Новости от TheMoneytizer

Китайская компания создала передовую модель искусственного интеллекта, которая потребляет в 11 раз меньше вычислительных ресурсов, чем ее конкуренты

Эта информация говорит о том, что, хотя санкции США повлияли на доступность оборудования для ИИ в Китае, учёные работают над тем, чтобы извлечь максимальную производительность из ограниченного количества оборудования и уменьшить влияние сокращения поставок чипов для ИИ в Китай.
Компания опубликовала модель и весовые коэффициенты в открытом доступе, тестирование начнётся в ближайшее время.

Компания Deepseek всего за два месяца обучила свою языковую модель DeepSeek-V3 Mixture-of-Experts (MoE) с 671 миллиардом параметров с помощью кластера, состоящего из 2048 графических процессоров Nvidia H800, что составляет 2,8 миллиона часов работы графических процессоров. Для сравнения: Meta потребовалось в 11 раз больше вычислительной мощности (30,8 млн часов работы графических процессоров) для обучения Llama 3 с 405 миллиардами параметров с помощью кластера, состоящего из 16 384 графических процессоров H100, в течение 54 дней.

DeepSeek утверждает, что значительно снизила требования к вычислительным мощностям и памяти, которые обычно требуются для моделей такого масштаба, с помощью передовых конвейерных алгоритмов, оптимизированной системы коммуникации и вычислений с низкой точностью FP8.

Компания использовала кластер из 2048 графических процессоров Nvidia H800, каждый из которых был оснащён межсоединением NVLink для связи между графическими процессорами и межсоединением InfiniBand для связи между узлами. В таких системах связь между графическими процессорами довольно быстрая, а связь между узлами — нет, поэтому оптимизация является ключом к повышению производительности и эффективности. Хотя DeepSeek внедрила десятки методов оптимизации для снижения вычислительных требований DeepSeek-v3, несколько ключевых технологий позволили добиться впечатляющих результатов.

 

 

Сообщение Китайская компания создала передовую модель искусственного интеллекта, которая потребляет в 11 раз меньше вычислительных ресурсов, чем ее конкуренты появились сначала на Время электроники.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Главные новости дня, 2 января 2025 года

Около 2,4 тысячи тонн мазута вытекло в Черное море после крушения танкеров

"ИИСУС ИЗ УСБ": СЕНСАЦИЯ: "Z" и "АЗ" В НЕЙРО ОРУДИЯХ СВО. МНОГО НАТО НЕ НАДО ХОРОШИМ ДРУЗЬЯМ! СЕНСАЦИОННЫЕ ВАЖНЫЕ НОВОСТИ! Россия, США, Европа могут улучшить отношения и здоровье общества?!

Умерла Инна Выходцева, сыгравшая в «Служебном романе» и «Москва слезам не верит»

Музыкальные новости

"Спартак" хочет продлить Руслана Литвинова?

Врач Михаил Кутушов рассказал, как избежать проблем с перееданием в Новый год

Про маньяков, Жириновского и моделей: топ-5 самых ожидаемых сериалов 2025 года

BN: сделка Путина с Индией на 13 млрд долларов нанесла удар по Западу

Новости России

Замглавы академии Вешкину предъявили обвинение в получении взятки в крупном размере

В Гидрометцентре спрогнозировали похолодание и гололедицу в Москве 3 января

Около 2,4 тысячи тонн мазута вытекло в Черное море после крушения танкеров

Директор Чигирев назвал вбросом возвращение певца Леонтьева на большую сцену

Экология в России и мире

Никогда не понимала тех, у кого портится тыква. Показываю, какой вкусный десерт в духовке я из неё готовлю

Подкаст "Женское дело. Лаборатория успеха". В гостях Ксения Подхватиловская

Что опытные дачники добавляют в воду для полива декабриста: растение укроется одеялом из цветов

Carolina Herrera pre-fall 2025

Спорт в России и мире

"Уехала в США, родила от друга принца Уильяма и принца Гарри". Как сложилась судьба Марии Шараповой

Брисбен (ATP). 1/4 финала. Джокович сыграет с Опелкой. Димитров – с Томпсоном

Касаткина выходит в третий круг WTA-500 в Брисбене после трёхчасовой борьбы

Капризов стал лучшим снайпером года в НХЛ, Кудерметова прошла Касаткину. Главное к утру

Moscow.media

Пенсионеры назвали самые любимые направления в новогодние праздники

Врач рассказала, почему появляется седина и можно ли остановить этот процесс

Окно в прошлый век

31.12.2024











Топ новостей на этот час

Rss.plus






Около 2,4 тысячи тонн мазута вытекло в Черное море после крушения танкеров

В Гидрометцентре спрогнозировали похолодание и гололедицу в Москве 3 января

Замглавы академии Вешкину предъявили обвинение в получении взятки в крупном размере

Глава ФТР Тарпищев заявил, что "Спартаку" нужно усилить центр защиты