Добавить новость

988 детей-сирот Подмосковья получили жилье в этом году

Телеведущий Андрей Норкин показал пародию на первого президента России Ельцина

В Минздраве РФ рассказали о состоянии выживших в авиакатастрофе в Актау россиян

Дед Мороз из Великого Устюга подарил сувениры пассажирам столичного метро





Новости сегодня

Новости от TheMoneytizer

Китайцы не отстают: обновлённая нейросеть DeepSeek превосходит GPT-4o и Llama 3.1

Вчера, 26 декабря, китайская компания DeepSeek, которая специализируется на разработке и обучении больших языковых моделей искусственного интеллекта, официально представила миру свою новую модель DeepSeek V3 — одно из самых мощных «открытых» решений на сегодняшний день. Например, в рамках проведения испытаний в области написания кода данная модель почти во всех тестах обошла новейшую GPT-4o от OpenAI, Llama 3.1, Claude 3.5 Sonnet и Qwen 2.5 от Alibaba. Особенно стоит обратить внимание на тест Aider Polyglot, который испытывает возможность большой языковой модели дописывать и интегрировать новый код в уже существующий.

Также новая модель справилась с наибольшим количеством задач с платформы Codeforces, на которой проводятся состязания для программистов со всего мира. Впрочем, значительные достижения у новинки заметны не только в написании кода — при решении математических задач DeepSeek V3 заметно лучше справляется с тестом MATH-500, а в CNMO 2024 буквально на голову разбивает оппонентов. Для примера, свежая модель набирает 43,2 балла в тесте, где GPT-4o показала всего 10,8 балла. При этом весьма забавно, что ИИ из Китая лучше разбирается не только с задачами, связанными с китайским языком, но и обходит американских конкурентов в случае с английским.

Но и это ещё не всё — представители китайской компании заявили, что им удалось обучить DeepSeek V3 всего за два месяца, используя центр обработки данных на базе графических ускорителей NVIDIA H800. На эту задачу у них ушло всего 5,5 миллиона долларов — для сравнения, компания OpenAI потратила на обучение семейства моделей GPT-4 примерно 78 миллионов долларов. И это при учёте того, что у американской компании есть полный доступ к передовым технологиям компании NVIDIA, а китайские исследователи находятся под санкциями и просто не могут купить топовые решения последнего поколения. Вероятно, без таких ограничений ИИ из Китая был бы ещё мощнее.

Кроме того, представители китайской компании выпустили свою модель DeepSeek V3 в открытый доступ с лицензией, которая предоставляет пользователям возможность загружать LLM, модифицировать её и даже использовать в своих приложениях — в том числе коммерческих. Это в корне отличается от «закрытых» больших языковых моделей от той же OpenAI, которая предоставляет доступ к своей нейросети исключительно через API и взимает плату за доступ к новейшим решениям, либо же ограничивает количество запросов с бесплатной подпиской.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Введен в эксплуатацию второй корпус в составе жилого комплекса в Молжаниновском районе

Минздрав РФ: состояние 2 пострадавших в авиакатастрофе в Актау остается тяжелым

Итоги реализации нацпроекта «Образование» подвели в Подмосковье

Рецепты салатов: простые салаты, как быстро и вкусно приготовить

Музыкальные новости

Мостовой: прожить на 30 тысяч рублей в месяц нереально

В Приморском филиале ведомственной охраны Минтранса России прошли учебно-методические сборы начальников команд

СЛД «Сольвычегодск» прошло ресертификацию системы менеджмента качества (СМК)

Первая премия Федерации спортивного программирования России: итоги года и награды для лучших из лучших!

Новости России

Турсервис Russpass представил топ новых достопримечательностей Москвы

Введен в эксплуатацию второй корпус в составе жилого комплекса в Молжаниновском районе

Источник: Нигматуллин снимает квартиру после развода, жена забрала всю его недвижимость

Итоги реализации нацпроекта «Образование» подвели в Подмосковье

Экология в России и мире

Скорость и драйв на Воробьевых горах

Японский Новый год в «Тропикана Парк»

Что работодатели должны знать о поколении Z?

Дочь Успенской признали "Лучшей поэтессой года" и наградили. А за какие заслуги?

Спорт в России и мире

Соболенко и Бордиловская разделили звание лучшей спортсменки по версии НОК

Даниил Медведев обошёл Пита Сампраса по сумме заработанных за карьеру призовых

Тарпищев: в 2025 году Мирра Андреева может войти в первую десятку WTA

Открытие Игр в Париже, допинг Синнера и Свёнтек и заявление Федорищева: главные скандалы 2024 года в спорте

Moscow.media

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Дайджест новостей «Грузовичкоф» за декабрь

ПЕРВОЛЕДЬЕ











Топ новостей на этот час

Rss.plus






Новый кроссовер Mazda CX-5 продают в России за 2,8 млн рублей

Президент Путин подписал закон об ужесточении ответственности за вооруженный мятеж

Турсервис Russpass представил топ новых достопримечательностей Москвы

«Ливио»: качественная мебель с душой