Добавить новость

Дирижер: к классической музыке детей необходимо приобщать как можно раньше

Мужчина изнасиловал 13-летнюю дочь сожительницы в подмосковном Серпухове

В Госдуме рассмотрят вопрос чрезмерной нагрузки на школьников

Медведев призвал к политическому и экономическому наказанию Европы



Новости сегодня

Новости от TheMoneytizer

Кризис достоверности в искусственном интеллекте: OpenAI показала, что LLM выдают ложные ответы в 60% случаев

Компания OpenAI представила новый бенчмарк под названием SimpleQA для оценки точности выходных данных собственных и конкурирующих моделей ИИ. Однако результаты тестирования выявили серьёзные проблемы с достоверностью информации, генерируемой современными крупными языковыми моделями (LLM).

Цель нового бенчмарка — обеспечить объективную оценку точности и надёжности LLM, которые всё чаще используются в различных сферах жизни, от образования и разработки программного обеспечения до здравоохранения и правоохранительных органов. Однако, как показало тестирование, даже самые передовые модели, такие как o1 от OpenAI и Claude-3.5-sonnet от Anthropic, демонстрируют крайне низкие показатели успешности - 42,7% и 28,9% соответственно.

Источник: Michael Dwyer / AP

Проблема усугубляется тем, что модели склонны «переоценивать свои возможности» и выдавать ответы, которые являются полной ерундой, известной как «галлюцинации». Эта тенденция хорошо документирована и может привести к серьёзным последствиям, особенно в таких чувствительных областях, как здравоохранение и правоохранительная деятельность. Например, модель ИИ, используемая в больницах и построенная на технологии OpenAI, была замечена в частых галлюцинациях и неточностях при расшифровке взаимодействий с пациентами. Полицейские в США также начинают использовать ИИ, что может привести к ложным обвинениям невиновных или усилению предубеждений.

По словам экспертов, результаты тестирования на бенчмарке SimpleQA являются тревожным сигналом о том, что нынешние LLM крайне неспособны достоверно говорить правду. «Это событие должно послужить напоминанием о том, что к любому результату работы любого LLM следует относиться с изрядной долей скептицизма и быть готовым тщательно проверять сгенерированный текст», — заявил представитель OpenAI.

Остаётся открытым вопрос, можно ли решить проблему достоверности LLM с помощью ещё больших обучающих наборов, как утверждают лидеры в области ИИ. Однако, по мнению некоторых экспертов, необходимо искать новые подходы к разработке моделей ИИ, которые бы обеспечивали более высокую точность и надёжность генерируемой информации. «Мы должны сосредоточиться на разработке моделей, которые могут не только генерировать правдоподобные ответы, но и оценивать их и отказываться от ответа, когда не уверены в достоверности», — отметил один из исследователей в области ИИ.

Результаты тестирования на бенчмарке SimpleQA подчёркивают необходимость дальнейших исследований и разработок в области искусственного интеллекта, чтобы обеспечить надёжность и достоверность генерируемой информации и предотвратить потенциальные негативные последствия использования LLM в различных сферах жизни.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

КХЛ не стала наказывать защитника ЦСКА за эпизод с травмой Кузнецова

Программа «Темы дня» (26.12.2024) на телеканале «Красная Линия»

Преподаватель из Улан-Удэ стала лучшим наставником в музыкальном искусстве

Мужчина изнасиловал 13-летнюю дочь сожительницы в подмосковном Серпухове

Музыкальные новости

«Единая Россия» поздравила серебряных волонтеров с Новым Годом

Желдорреммаш внедряет автоматизированную систему «Акт о несоответствии»

Путин пригласил воинские расчеты стран СНГ принять участие в параде Победы

ЧЭРЗ подготовил новогодние сюрпризы для своих сотрудников

Новости России

Дирижер: к классической музыке детей необходимо приобщать как можно раньше

В предновогодние выходные в кинопарке «Москино» снова покажут «Соборную площадь»

В Госдуме рассмотрят вопрос чрезмерной нагрузки на школьников

Стартовала модернизация крупного газорегуляторного пункта на юго-западе Москвы

Экология в России и мире

СЛД «Сольвычегодск» прошло ресертификацию системы менеджмента качества (СМК)

Рождественское путешествие

Надолго и всерьез: «детский» формат ГПМ Радио запущен в 30 городах

Первое издание «Мастера и Маргариты» с автографом Елены Булгаковой выставили на аукцион

Спорт в России и мире

Энди Роддик назвал имя теннисистки, которая может удивить всех в 2025 году

Тарпищев: в 2025 году Мирра Андреева может войти в первую десятку WTA

Александр Зверев: «Все еще считаю, что в этом году я показал свой лучший теннис на «Уимблдоне». Было очень, очень обидно получить травму колена»

Матс Виландер: «В 2025-м Синнер выиграет больше «Шлемов», чем Алькарас. Мой очень, очень, очень смелый прогноз – один из них оформит календарный Большой шлем»

Moscow.media

Орловские власти вновь не смогли справиться с задачей обеспечения необходимыми лекарствами

Поздняя осень...

Филиал № 4 ОСФР по Москве и Московской области информирует: Свыше 110 уроков пенсионной грамотности провели сотрудники Отделения СФР по Москве и Московской области

Утро перед ненастьем....











Топ новостей на этот час

Rss.plus






Мужчина изнасиловал 13-летнюю дочь сожительницы в подмосковном Серпухове

Названы районы Старой Москвы с самыми доступными новостройками

Минтранс прорабатывает меры по ликвидации последствий аварии в Керченском проливе

Земельный надзор Росреестра ответил на вопросы ...