Добавить новость

Мишустин назвал историческим визит президента Ирана Пезешкиана в Россию

Мечтают ли электроовцы об андроидах?

Омбудсмен рассказала о судьбе обнаруженного в подъезде на востоке Москвы младенца

В Москве иностранного массажиста осудят за домогательства к клиентке

News in English


Новости сегодня

Новости от TheMoneytizer

NVIDIA is helping Apple build a faster and better AI experience

Apple and NVIDIA shared details of a collaboration to improve the performance of LLMs with a new text generation technique for AI. Cupertino writes:

Accelerating LLM inference is an important ML research problem, as auto-regressive token generation is computationally expensive and relatively slow, and improving inference efficiency can reduce latency for users. In addition to ongoing efforts to accelerate inference on Apple silicon, we have recently made significant progress in accelerating LLM inference for the NVIDIA GPUs widely used for production applications across the industry.

Earlier this year, Apple published and open-sourced Recurrent Drafter (ReDrafter), which is a novel approach to speculative decoding that "achieves state of the art performance." According to the company, ReDrafter uses an RNN draft model, and combines beam search with dynamic tree attention to speed up LLM token generation by up to 3.5 tokens per generation step for open source models, surpassing the performance of prior speculative decoding techniques.

"In benchmarking a tens-of-billions parameter production model on NVIDIA GPUs, using the NVIDIA TensorRT-LLM inference acceleration framework with ReDrafter, we have seen 2.7x speed-up in generated tokens per second for greedy decoding," Apple papers show. With that, this technology could signifanctly reduce latency users may experience, while also using fewer GPUs and consuming less power.

This is especially useful as Apple keeps improving its Apple Intelligence platform. By offering faster and more accurated results, users will have a better experience when using Apple's AI tools. The company finishes its paper by saying ReDrafter can improve the experience with NVIDIA's GPUs:

LLMs are increasingly being used to power production applications, and improving inference efficiency can both impact computational costs and reduce latency for users. With ReDrafter’s novel approach to speculative decoding integrated into the NVIDIA TensorRT-LLM framework, developers can now benefit from faster token generation on NVIDIA GPUs for their production LLM applications.

If you're a developer and want to use the new ReDrafter tool, you can find detailed information on both Apple's website and NVIDIA's developer blog.

The post NVIDIA is helping Apple build a faster and better AI experience appeared first on BGR.

Today's Top Deals

  1. Today’s deals: $20 Waterproof Bluetooth speaker, $999 M3 MacBook Air, Duracell batteries, Cosori air fryer, more
  2. Today’s deals: $719 Black Apple Watch Ultra 2, Bissell Little Green, heated jackets, self-bagging trash can, more
  3. Today’s deals: $250 Apple iPad 10, $25 Crest 3D Whitestrips, laptop deals, $100 off Bose SoundLink Max, more
  4. Best Apple Watch deals for December 2024

NVIDIA is helping Apple build a faster and better AI experience originally appeared on BGR.com on Fri, 20 Dec 2024 at 06:52:40 EDT. Please see our terms for use of feeds.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Суд наложил арест на имущество и 45 млн блогера Лерчек, которая находится под следствием

В Госдуме предложили снизить число обязательных предметов по ОГЭ

Сбой произошел на МЦД-4 из-за остановки состава по техническим причинам

Ушаков: контактов Москвы с командой Трампа пока не было

Музыкальные новости

Новое оборудование в СЛД «Магдагачи»

Путин сообщил о планах присвоить звание «Город трудовой доблести» еще восьми городам

Седоковой рекомендовали не выезжать из России из-за расследования смерти Тиммы

AI Певица. Создание AI Певицы. AI Певец. AI Артист. Создание и продвижение AI Певицы.

Новости России

Врач: погружение в ледяную воду — серьёзное испытание для организма

Сбой произошел на МЦД-4 из-за остановки состава по техническим причинам

Фотографии Полистовского заповедника представили в Дарвиновском музее

Суд наложил арест на имущество и 45 млн блогера Лерчек, которая находится под следствием

Экология в России и мире

Самодиагностика по языку: доктор Кутушов назвал неочевидные признаки болезней

Самодиагностика по языку: доктор Кутушов назвал неочевидные признаки болезней

Скидки для именинников в «Тропикана Парк»

Актер «Игры в кальмара» вышел на красную дорожку и удивил фанатов внешним видом

Спорт в России и мире

Теннисистка Шнайдер победила Томлянович и впервые сыграет в третьем круге AO

Джокович стал рекордсменом по количеству матчей на турнирах "Большого шлема"

«Фонсека в матче с Рублёвым в Австралии сыграл просто великолепно и не дал Андрею вернуться» — Петрова

Теннисист Даниил Медведев проиграл 121-й ракетке мира во втором круге Australian Open

Moscow.media

Терминал сбора данных (ТСД) промышленного класса SAOTRON RT42G

Портативный ТСД корпоративного класса Saotron RT-T70

По требованию прокурора проведен ремонт путей необщего пользования

"Оренбургский вулкан"











Топ новостей на этот час

Rss.plus






Мишустин назвал историческим визит президента Ирана Пезешкиана в Россию

Персональная выставка художника Евгении Лясниковой пройдет в Новой Третьяковке

Песков: в Кремле не ждут существенных изменений позиции США по санкциям

Омбудсмен рассказала о судьбе обнаруженного в подъезде на востоке Москвы младенца