Ученые "Яндекса" разработали решение, которое позволит бизнесу сократить расходы на внедрение нейросетей до восьми раз

24.07.2024 19:39

News 2.ru

Команда Yandex Research совместно с исследователями IST Austria и KAUST разработала и опубликовала в свободном доступе новые методы сжатия больших языковых моделей. Они позволяют сократить бизнесу расходы на вычислительные ресурсы до восьми раз. Решение полезно корпорациям, стартапам и исследователям, которые запускают нейросети на своем оборудовании. Об этом CNews сообщили представители "Яндекса".

Чтобы большая языковая модель отвечала качественно и быстро, требуется множество дорогостоящих мощных графических процессоров. Решение Яндекса позволяет уменьшить модель в несколько раз. Это сокращает количество необходимых для работы процессоров и позволяет запустить ее на устройствах с меньшей вычислительной мощностью. То есть делает внедрение нейросетей и обслуживание оборудования дешевле для бизнеса. При использовании других методов сжатия значительно теряется качество ответов нейросети. Метод, разработанный учеными "Яндекса", решает эту проблему.

Решение компании включает два инструмента. Первый позволяет получить уменьшенную до восьми раз нейросеть, которая быстрее работает и может быть запущена, например, на одном графическом процессоре вместо четырех. Второй инструмент исправляет ошибки, которые возникают в процессе сжатия большой языковой модели.

Эффективность методов сжатия нейросетей оценивали на популярных моделях с открытым исходным кодом: Llama 2, Llama 3, Mistral и других. Качество ответов оригинальной и сжатой версии нейросети сравнивали на англоязычных бенчмарках - тестах, которые состоят из наборов вопросов в разных областях знаний. Новый подход показал лучший результат среди всех существующих методов сжатия. Метод "Яндекса" сохраняет в среднем 95% качества ответов нейросети. Для сравнения, другие популярные инструменты сохраняют для тех же моделей от 59% до 90% качества

Новые методы сжатия нейросетей уже доступны для применения - код опубликован на GitHub. Специалисты также могут скачать уже сжатые с помощью новых методов популярные модели с открытым исходным кодом. Кроме того, исследователи Yandex Research выложили обучающие материалы, которые помогут разработчикам дообучить уменьшенные нейросети под свои сценарии.

Научная статья Yandex Research о методе сжатия AQLM была включена в программу одной из самых престижных в мире конференций по машинному обучению - ICML. Статья была подготовлена совместно с исследователями из Института науки и технологий Австрии (ISTA) и экспертами ИИ-стартапа Neural Magic.

(https://www.cnews.ru/news...)

Новости от наших партнёров в Вашем городе

Ria.city

123ru.net

В Подмосковье провели мастер-класс для детей «Животные»

РИА НОВОСТИ: ДОНАЛЬД ТРАМП НАБИРАЕТ 295 ГОЛОСОВ ВЫБОРЩИКОВ. Возможны корректировки. Россия, США, Европа могут улучшить отношения и здоровье общества?!

Жители Краснодара получат новые возможности для занятий спортом

Почему следователь и именитые спортсмены Якутии подались в наркокурьеры?

Музыкальные новости

Bigpot.news

Edlix.ru открывает двери лучшим ВУЗам России для расширения доступа к образованию

Музыкальный менеджер. Менеджер музыкальной группы. Музыкальный менеджер директор.

Сергей Собянин: Новая станция ускорит развитие района

Ирина Роднина: «Фильмы о спорте имеют фантастический воспитательный эффект»

Новости России

29ru.net

В Подмосковье провели мастер-класс для детей «Животные»

Молодые мошенники из Новосибирска попались полицейским в Москве

CNN: Си Цзиньпин позвонил Трампу, чтобы поздравить его с победой на выборах

«Вечером на лобном, а после — плацкарт»: как Бузова совмещала «ДОМ-2» и учебу

Экология в России и мире

Life24.pro

Ритм мегаполиса в коллекции Marfa Fedorova на Московской неделе моды

«Союзник» России Азербайджан не прошёл «тест на дружбу»: в Баку на 13 лет осудили Назакет Мамедову, рассказавшую правду об СВО

«Какая же ты худая! Скорее поешь блинчиков!» 6 способов защититься от критики нашего тела и пищевого поведения

В Ростове-на-Дону прошёл концерт народного хора имени Пятницкого

Спорт в России и мире

News.tennis

Неймар назвал белорусскую теннисистку Арину Соболенко королевой

Медведев обошел Джоковича в рейтинге АТР

В России обесценили матч Елены Рыбакиной с первой ракеткой мира

Вместо Джоковича на Итоговый турнир ATP поедет Андрей Рублев

Moscow.media

News24.pro

Вячеслав Фетисов поздравил лыткаринцев с Днем народного единства

Путин назвал главу МИД КНДР Цой Сон Хи другом в День народного единства

«360»: Эрнст сравнил Стива Джобса с Гитлером из-за звонков и sms-сообщений

Более 150 Дмитровчан приняли участие в шествии в честь Дня народного единства

Читайте на 123ru.net

Жизнь

Путешествия

Новини України

Происшествия

Частные объявления в Вашем городе, в Вашем регионе и в России

Новости от наших партнёров в Вашем городе

В Подмосковье провели мастер-класс для детей «Животные»

РИА НОВОСТИ: ДОНАЛЬД ТРАМП НАБИРАЕТ 295 ГОЛОСОВ ВЫБОРЩИКОВ. Возможны корректировки. Россия, США, Европа могут улучшить отношения и здоровье общества?!

Жители Краснодара получат новые возможности для занятий спортом

Почему следователь и именитые спортсмены Якутии подались в наркокурьеры?

Edlix.ru открывает двери лучшим ВУЗам России для расширения доступа к образованию

Музыкальный менеджер. Менеджер музыкальной группы. Музыкальный менеджер директор.

Сергей Собянин: Новая станция ускорит развитие района

Ирина Роднина: «Фильмы о спорте имеют фантастический воспитательный эффект»

В Подмосковье провели мастер-класс для детей «Животные»

Молодые мошенники из Новосибирска попались полицейским в Москве

CNN: Си Цзиньпин позвонил Трампу, чтобы поздравить его с победой на выборах

«Вечером на лобном, а после — плацкарт»: как Бузова совмещала «ДОМ-2» и учебу

Ритм мегаполиса в коллекции Marfa Fedorova на Московской неделе моды

«Союзник» России Азербайджан не прошёл «тест на дружбу»: в Баку на 13 лет осудили Назакет Мамедову, рассказавшую правду об СВО

«Какая же ты худая! Скорее поешь блинчиков!» 6 способов защититься от критики нашего тела и пищевого поведения

В Ростове-на-Дону прошёл концерт народного хора имени Пятницкого

Неймар назвал белорусскую теннисистку Арину Соболенко королевой

Медведев обошел Джоковича в рейтинге АТР

В России обесценили матч Елены Рыбакиной с первой ракеткой мира

Вместо Джоковича на Итоговый турнир ATP поедет Андрей Рублев

Спасателям вынесли приговор за смерть ребенка в челябинском термальном комплексе

Аттракцион

Филиал № 4 ОСФР по Москве и Московской области информирует: Социальный фонд выплатит остатки материнского капитала менее 10 тысяч рублей

*Meta незаконно использовала финансовые данные пользователей в рекламе

Топ новостей на этот час

«Вечером на лобном, а после — плацкарт»: как Бузова совмещала «ДОМ-2» и учебу

CNN: Си Цзиньпин позвонил Трампу, чтобы поздравить его с победой на выборах

Байден впервые прокомментировал поражение Харрис на выборах президента США

Источник 360.ru: 8 гаражей загорелись в Алтуфьевском районе Москвы