Добавить новость

В Латвии возбуждено уголовное дело по факту смерти Яниса Тиммы

В Сети появилось видео с места ДТП с участием 95 машин в Казахстане

Реклама сотовой сети Билайн, 1997 год, Москва

На востоке Москвы загорелся расположенный на первом этаже жилого дома магазин



Новости сегодня

Новости от TheMoneytizer

Китайская компания создала передовую модель искусственного интеллекта, которая потребляет в 11 раз меньше вычислительных ресурсов, чем ее конкуренты

Эта информация говорит о том, что, хотя санкции США повлияли на доступность оборудования для ИИ в Китае, учёные работают над тем, чтобы извлечь максимальную производительность из ограниченного количества оборудования и уменьшить влияние сокращения поставок чипов для ИИ в Китай.
Компания опубликовала модель и весовые коэффициенты в открытом доступе, тестирование начнётся в ближайшее время.

Компания Deepseek всего за два месяца обучила свою языковую модель DeepSeek-V3 Mixture-of-Experts (MoE) с 671 миллиардом параметров с помощью кластера, состоящего из 2048 графических процессоров Nvidia H800, что составляет 2,8 миллиона часов работы графических процессоров. Для сравнения: Meta потребовалось в 11 раз больше вычислительной мощности (30,8 млн часов работы графических процессоров) для обучения Llama 3 с 405 миллиардами параметров с помощью кластера, состоящего из 16 384 графических процессоров H100, в течение 54 дней.

DeepSeek утверждает, что значительно снизила требования к вычислительным мощностям и памяти, которые обычно требуются для моделей такого масштаба, с помощью передовых конвейерных алгоритмов, оптимизированной системы коммуникации и вычислений с низкой точностью FP8.

Компания использовала кластер из 2048 графических процессоров Nvidia H800, каждый из которых был оснащён межсоединением NVLink для связи между графическими процессорами и межсоединением InfiniBand для связи между узлами. В таких системах связь между графическими процессорами довольно быстрая, а связь между узлами — нет, поэтому оптимизация является ключом к повышению производительности и эффективности. Хотя DeepSeek внедрила десятки методов оптимизации для снижения вычислительных требований DeepSeek-v3, несколько ключевых технологий позволили добиться впечатляющих результатов.

 

 

Сообщение Китайская компания создала передовую модель искусственного интеллекта, которая потребляет в 11 раз меньше вычислительных ресурсов, чем ее конкуренты появились сначала на Время электроники.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Открываем сезон кросса 2025!

Реклама сотовой сети Билайн, 1997 год, Москва

Юрист Хаминский рассказал о мошенничестве с якобы вызовом в коллегию присяжных

На востоке Москвы загорелся расположенный на первом этаже жилого дома магазин

Музыкальные новости

«Северсталь» — «Динамо» Москва — 2:7. Видеообзор матча КХЛ

Шахматист Мурзин о победе на ЧМ по рапиду: ехал на турнир занять первое место

Продать стихи. Как продать стихи. Продать стихи собственного сочинения. Где продать стихи.

Продвижение Песен и Музыки в Яндекс Музыка. 

Новости России

Юрист Хаминский рассказал о мошенничестве с якобы вызовом в коллегию присяжных

Денежный спуск: во сколько обойдется отдых на горнолыжных курортах

В Латвии возбуждено уголовное дело по факту смерти Яниса Тиммы

Великобритания отправит 2600 военных и 730 машин на учения НАТО в Восточной Европе

Экология в России и мире

Магнетрон, матричный слой и фотоэлектрические свойства…

Справятся даже женщины: как убрать пень на участке, не выкорчевывая его

Продать стихи. Как продать стихи. Продать стихи собственного сочинения. Где продать стихи.

Исследование дежавю и жамевю: что происходит с нашей памятью?

Спорт в России и мире

Боня в костюме страуса, укутанная салатом Шарапова, Долина со змеей на голове: эксперименты звезд со стилем в 2024-м

Касаткина за три с половиной часа одолела американку Стирнс на турнире WTA

Рублёв выпадет из топ-8 после поражения на турнире ATP в Гонконге

«Легче подняться на какой‑то уровень, чем там удержаться». Ольховский — о прогрессе Андреевой и Шнайдер в 2025 году

Moscow.media

ИИ начнет продавать ваши решения до их совершения, предупредили эксперты

Пенсионеры назвали самые любимые направления в новогодние праздники

После массового убийства в Черногории преступник покончил с собой

Врач рассказала, почему появляется седина и можно ли остановить этот процесс











Топ новостей на этот час

Rss.plus






На востоке Москвы загорелся расположенный на первом этаже жилого дома магазин

Великобритания отправит 2600 военных и 730 машин на учения НАТО в Восточной Европе

Змея выползла из вытяжки на кухне в Хорошово-Мневниках

За аморалку. Конькобежка Стенина открыла, как ее с мужем арестовали в США