Добавить новость

Эксперт: в РФ растет импортозамещение морского торгового судоходства

Число малых и средних предпринимателей в сфере образования выросло на 27% за три года

Москва одобрила планы строительства детсада и школы в Западном Дегунине

Переход португальца Мангаша в «Спартак» может сорваться из-за скандального видео





Новости сегодня

Новости от TheMoneytizer

В России создали «бенчмарк» для оценки нейросетей

Почти как AnTuTu, но не для смартфонов, а для ИИ.

В России разработали первую независимую платформу для оценки качества больших языковых моделей. Она называется LLM Arena. Ее создателем стал Роман Куцин, который взаимодействовал с экс-разработчиками TrainingData.ru, где он был техническим директором, и экспертами по ИИ-моделям.

С помощью бенчмарка можно тестировать нейросети, которые работают на русском языке. Большие языковые модели оценивают на основе пользовательских задач. Все желающие могут сравнивать ответы в зависимости от запросов. Работает LLM Arena следующим образом. Пользователю для сравнения дают две случайные модели, при этом ему не показывают информацию о том, кто их разработал. Затем можно написать любой запрос и выбрать ответ, который покажется лучшим по любой причине. Помимо этого, есть возможность отметить, что ответы оказались похожими или не соответствующими задаче.

Пока что пользователи LLM Arena могут протестировать 21 нейросеть. На платформу добавили самые популярные варианты. Например, там есть зарубежная большая языковая модель ChatGPT, а а также российские YandexGPT и GigaChat. В дальнейшем список ИИ-моделей расширится. При этом сами разработчики также смогут их добавить. Бенчмарк разработали по открытой лицензии, он работает по принципу популярного рейтинга LMSYS Chatbot Arena.

Как отметили создатели платформы, их задача — сделать объективный и актуальный рейтинг генеративных нейросетей на русском языке. По их словам, уже есть немало способов сравнивать модели, но сложно протестировать их на родном языке и настоящих пользовательских задачах. Авторы LLM Arena отметили, что скоро добавят в сервис возможность оценивать качество ответов в зависимости от категории запроса, в том числе по написанию кода. А в дальнейшем пользователи смогут сравнивать определение содержимого на изображениях и генерацию видео по тексту.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Подмосковье впервые заняло призовое место на Спартакиаде учащихся

Средний балл поступления в МГРИ достиг рекорда за последние 6 лет

Песков заявил, что Россия не вмешивается в выборы в США

Владимир Машков принял участие в онлайн-голосовании на выборах в Мосгордуму

Музыкальные новости

Трамп оказался в замешательстве из-за шутки Путина о «поддержке» Харрис

«Не знал ни русского, ни английского»: Игорь Крутой рассказал, чем зацепил его Денберел Ооржак

Белому дому не понравились комментарии Путина об американских выборах

«Динамо», несмотря на гол Гусева, проиграло «Куньлуню» в первом матче сезона

Новости России

Белоруссия направила военнослужащих в РФ на учения с боевыми пусками ракет

Владимир Машков принял участие в онлайн-голосовании на выборах в Мосгордуму

Песков заявил, что Россия не вмешивается в выборы в США

Подмосковье впервые заняло призовое место на Спартакиаде учащихся

Экология в России и мире

Врач-стоматолог Наталья Тышкевич: как вовремя распознать пародонтоз

Возвращение игры «Миллион за улыбку» в день рождения «Юмор FM»

“Фанагория” получила сразу 7 высоких наград Международного конкурса Asia Wine Сhallenge в китайском Гонконге

«585*ЗОЛОТОЙ» отмечена в рейтинге лучших брендов Санкт-Петербурга

Спорт в России и мире

Front Office Sport: слияние ATP и WTA может быть завершено в первой половине 2025 года

Тиафу об Арене Артура Эша: «Я всегда мечтал играть на этом корте. Тут я лучшая версия себя»

Тренер Янчук назвал матч Синнера и Медведева достойным финала US Open

Дрэйпер отдал 36 геймов на пути в полуфинал US Open. За последние 40 лет только Лендл и Джокович проигрывали меньше

Moscow.media

Начался второй этап реконструкции автодороги Средние Ачалуки - Плиево в Ингушетии

Колымские столбы.

Орловской полицией задержан пособник мошенников за помощь в обмане пенсионерки на 400 тысяч рублей

Работники СЛД «Магдагачи» филиала «Забайкальский» компании «ЛокоТех-Сервис» организовали экологический десант











Топ новостей на этот час

Rss.plus






Лучше не болеть. Врач развеял 4 устойчивых мифа про ветрянку

Песков заявил, что Россия не вмешивается в выборы в США

Глава Воскресенска проверил готовность теплоэлектростанции к зиме

Даже не верится, что будет так быстро: синоптики предсказали, когда выпадет снег