NVIDIA is helping Apple build a faster and better AI experience

20.12.2024 14:52

BGR.com

Apple and NVIDIA shared details of a collaboration to improve the performance of LLMs with a new text generation technique for AI. Cupertino writes:

Accelerating LLM inference is an important ML research problem, as auto-regressive token generation is computationally expensive and relatively slow, and improving inference efficiency can reduce latency for users. In addition to ongoing efforts to accelerate inference on Apple silicon, we have recently made significant progress in accelerating LLM inference for the NVIDIA GPUs widely used for production applications across the industry.

Earlier this year, Apple published and open-sourced Recurrent Drafter (ReDrafter), which is a novel approach to speculative decoding that "achieves state of the art performance." According to the company, ReDrafter uses an RNN draft model, and combines beam search with dynamic tree attention to speed up LLM token generation by up to 3.5 tokens per generation step for open source models, surpassing the performance of prior speculative decoding techniques.

"In benchmarking a tens-of-billions parameter production model on NVIDIA GPUs, using the NVIDIA TensorRT-LLM inference acceleration framework with ReDrafter, we have seen 2.7x speed-up in generated tokens per second for greedy decoding," Apple papers show. With that, this technology could signifanctly reduce latency users may experience, while also using fewer GPUs and consuming less power.

This is especially useful as Apple keeps improving its Apple Intelligence platform. By offering faster and more accurated results, users will have a better experience when using Apple's AI tools. The company finishes its paper by saying ReDrafter can improve the experience with NVIDIA's GPUs:

LLMs are increasingly being used to power production applications, and improving inference efficiency can both impact computational costs and reduce latency for users. With ReDrafter’s novel approach to speculative decoding integrated into the NVIDIA TensorRT-LLM framework, developers can now benefit from faster token generation on NVIDIA GPUs for their production LLM applications.

If you're a developer and want to use the new ReDrafter tool, you can find detailed information on both Apple's website and NVIDIA's developer blog.

Don't Miss: Apple Intelligence: AI, features, research, and supported devices

The post NVIDIA is helping Apple build a faster and better AI experience appeared first on BGR.

Today's Top Deals

NVIDIA is helping Apple build a faster and better AI experience originally appeared on BGR.com on Fri, 20 Dec 2024 at 06:52:40 EDT. Please see our terms for use of feeds.

Новости от наших партнёров в Вашем городе

Ria.city

123ru.net

Интересные каналы в Telegram. Лучшие каналы в Telegram. Каталог каналов Telegram

Франц Лефорт. Друг, советник и наставник Петра I

"Фонтанка": в школе Петербурга ребенок получил ручкой в глаз

"Фонтанка": в Ленобласти неизвестные ограбили дачу пенсионера на 5 млн рублей

Музыкальные новости

Bigpot.news

Жена Башара Асада начала лечение от рака в Москве еще до его побега

Группа студентов из МГППУ сопровождала интерактивный квест на молодежном форуме корпорации «Роскосмос»

«Это безобразие»: Путин пообещал навести порядок в ипотечных программах

Алсу, Алексей Воробьев, Лариса Долина, Амирчик и другие звезды на съемках «Рождественской песенки года»

Новости России

29ru.net

Китай, прощай! Как российскому автопroduкту адаптироваться к новым условиям рынка?

Полюбоваться солнцестоянием и звездным небом приглашают псковичей в Полистовском заповеднике

«Крокус» уроком не стал, теперь генерал Кириллов: будет визовый режим или продолжим жить «в безопасности» по Федорову

"Фонтанка": в Ленобласти неизвестные ограбили дачу пенсионера на 5 млн рублей

Экология в России и мире

Life24.pro

Буйнов отреагировал на сообщения о прогрессирующей болезни

«Я сама его воспитала»: почему домашнее насилие над пожилыми людьми такое невидимое

Как Киркоров и Дорохов породнились: комедия «Братья» выходит при поддержке «Авторадио»

Косметолог-эстетист Наталья Рябинова: 4 экспресс-процедуры к Новому году

Спорт в России и мире

News.tennis

Вероника Кудерметова поднялась на одну строчку в рейтинге WTA

Анна Калинская снялась для обложки журнала Harper’s Bazaar и попросила не спрашивать её о романе с Янником Синнером

Арина Соболенко выложила эффектные фото в коротком платье

Спортсмены и рекламные ролики: Джокович в пасти у крокодила, а Овечкин — доставщик пиццы

Moscow.media

News24.pro

Врачи частных клиник в Москве обошли в зарплате пеших курьеров

Авиалайнеры из Якутска и Москвы 21 декабря в аэропорту Владивостока прилетают и вылетают вне графика

ВСУ могли использовать для атаки Казани дроны модели «Лютый»

Франц Лефорт. Друг, советник и наставник Петра I

Читайте на 123ru.net

Видео-новости

Личное

Интернет

Новини України

Частные объявления в Вашем городе, в Вашем регионе и в России

Новости от наших партнёров в Вашем городе

Интересные каналы в Telegram. Лучшие каналы в Telegram. Каталог каналов Telegram

Франц Лефорт. Друг, советник и наставник Петра I

"Фонтанка": в школе Петербурга ребенок получил ручкой в глаз

"Фонтанка": в Ленобласти неизвестные ограбили дачу пенсионера на 5 млн рублей

Жена Башара Асада начала лечение от рака в Москве еще до его побега

Группа студентов из МГППУ сопровождала интерактивный квест на молодежном форуме корпорации «Роскосмос»

«Это безобразие»: Путин пообещал навести порядок в ипотечных программах

Алсу, Алексей Воробьев, Лариса Долина, Амирчик и другие звезды на съемках «Рождественской песенки года»

Китай, прощай! Как российскому автопroduкту адаптироваться к новым условиям рынка?

Полюбоваться солнцестоянием и звездным небом приглашают псковичей в Полистовском заповеднике

«Крокус» уроком не стал, теперь генерал Кириллов: будет визовый режим или продолжим жить «в безопасности» по Федорову

"Фонтанка": в Ленобласти неизвестные ограбили дачу пенсионера на 5 млн рублей

Буйнов отреагировал на сообщения о прогрессирующей болезни

«Я сама его воспитала»: почему домашнее насилие над пожилыми людьми такое невидимое

Как Киркоров и Дорохов породнились: комедия «Братья» выходит при поддержке «Авторадио»

Косметолог-эстетист Наталья Рябинова: 4 экспресс-процедуры к Новому году

Вероника Кудерметова поднялась на одну строчку в рейтинге WTA

Анна Калинская снялась для обложки журнала Harper’s Bazaar и попросила не спрашивать её о романе с Янником Синнером

Арина Соболенко выложила эффектные фото в коротком платье

Спортсмены и рекламные ролики: Джокович в пасти у крокодила, а Овечкин — доставщик пиццы

Одежда, инструменты и хозтовары вошли в ТОП самых доставляемых грузов в маркетплейсы в преддверии Нового года

Концессионер мегасвалки получил в свои руки землю под Сысертью

Алсу, Алексей Воробьев, Лариса Долина, Амирчик и другие звезды на съемках «Рождественской песенки года»

Туристический налог на воздух введут 55 регионов РФ с 1 января 2025 года

Топ новостей на этот час

ВСУ могли использовать для атаки Казани дроны модели «Лютый»

Врачи частных клиник в Москве обошли в зарплате пеших курьеров

Франц Лефорт. Друг, советник и наставник Петра I

Языческое напутствие на удачу: как провести день зимнего солнцестояния 21 декабря