Добавить новость

В Москве у IT-специалиста нашли склад оружия и более 1600 патронов

YES ROBOTICS: внедрение решений интеллектуального производства

Житель Колпино избил возлюбленную полкой и грозился убить

Комедия «Купцы и дети» с Михаилом Пореченковым и Павлом Табаковым стартует 20 января

Блог сайта «iXBT.com»


Новости сегодня

Новости от TheMoneytizer

Apple и Nvidia объединили усилия для ускорения работы языковых моделей

Apple объявила о сотрудничестве с Nvidia в целях ускорения работы крупных языковых моделей (LLM) с использованием технологии с открытым исходным кодом Recurrent Drafter (сокращённо ReDrafter). Партнёрство направлено на решение вычислительных задач при авторегрессивной генерации токенов, что критически важно для повышения эффективности и снижения задержек в приложениях с языковыми моделями, работающими в реальном времени.

ReDrafter, представленный Apple в ноябре 2024 года, использует подход спекулятивного декодирования, объединяя рекуррентную нейронную сеть (RNN) с поиском и динамическим древовидным вниманием. Согласно тестам Apple, этот метод генерирует в 2,7 раза больше токенов в секунду по сравнению с традиционной авторегрессией.

Источник: Bloomberg

Благодаря интеграции во фреймворк Nvidia TensorRT-LLM, ReDrafter расширяет своё влияние, обеспечивая более быструю работу языковых моделей на GPU Nvidia, широко используемых в производственных средах. Для поддержки алгоритмов ReDrafter компания Nvidia внедрила новые операторы и модифицировала существующие в TensorRT-LLM, сделав технологию доступной для разработчиков, стремящихся оптимизировать производительность крупномасштабных моделей.

Помимо увеличения скорости, Apple утверждает, что ReDrafter способен снизить задержку для пользователей при использовании меньшего количества GPU. Такая эффективность не только снижает вычислительные затраты, но и уменьшает энергопотребление, что является важным фактором для организаций, работающих с искусственным интеллектом в больших масштабах.

Хотя в настоящее время сотрудничество сфокусировано на инфраструктуре Nvidia, в будущем аналогичные преимущества производительности могут быть распространены и на конкурирующие GPU от AMD или Intel.

По словам представителей Nvidia: «Это сотрудничество сделало TensorRT-LLM более мощным и гибким, позволяя сообществу разработчиков языковых моделей создавать более сложные модели и легко развёртывать их с помощью TensorRT-LLM для достижения непревзойдённой производительности на GPU Nvidia. Новые возможности открывают захватывающие перспективы, и мы с нетерпением ждём следующего поколения передовых моделей от сообщества, использующих возможности TensorRT-LLM, что приведёт к дальнейшему улучшению работы языковых моделей».

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Мастерство начинается… в пожарном депо

В Главном управлении Росгвардии по Московской области подвели итоги работы за 2024 год

SpaceX раскрыла дату нового испытательного полета Starship

Комедия «Купцы и дети» с Михаилом Пореченковым и Павлом Табаковым стартует 20 января

Музыкальные новости

Профилактическая акция Росгвардии «Безопасный Новый год» проходит в Смоленской области

Продвижение Песни или Музыки в YouTube, RuTube, ВКонтакте, ЯндексДзен и других видеоплощадках!

Сергей Собянин назвал ключевые объекты здравоохранения, открытые в 2024 году

«Дядя Петя, ты дурак?» Режиссера «ЗнаТоКов» в лицо знали по роли мерзавца

Новости России

Москвичка получила 15 протоколов за отказ уступить дорогу скорой помощи

Психолог Наумова назвала неожиданные причины и симптомы тревожности

В Москве у IT-специалиста нашли склад оружия и более 1600 патронов

Комедия «Купцы и дети» с Михаилом Пореченковым и Павлом Табаковым стартует 20 января

Экология в России и мире

Почему не у всех планет есть спутники

Сеть клиник «Будь Здоров» стала лауреатом III Национальной премии в области развития корпоративного спорта

Поэтам и Писателям любые возможности для творческого продвижения.

Могут ли самки быть крупнее самцов

Спорт в России и мире

Касаткина менее чем за час проиграла американке Киз в четвертьфинале турнира WTA в Аделаиде

Иванишевич впервые прокомментировал скандал вокруг Рыбакиной и Вукова

Шнайдер вышла во второй круг турнира WTA в Аделаиде, обыграв Синякову

Арина Соболенко станцевала вместе с командой после первого титула в сезоне. Видео

Moscow.media

ТСД промышленного класса Saotron RT-Т510

Екатеринбург попал в тройку городов с самой дорогой арендой однокомнатных квартир

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Мигранты-вахтовики вывезли с прииска два килограмма драгметаллов











Топ новостей на этот час

Rss.plus






Москвичка получила 15 протоколов за отказ уступить дорогу скорой помощи

«Такие оттепели – это совсем, очень плохо!»: как циклоны «заливают» Татарстан январским дождем со снегом

Результаты Премии World Travel Awards 2024

Комедия «Купцы и дети» с Михаилом Пореченковым и Павлом Табаковым стартует 20 января