Дирижер: к классической музыке детей необходимо приобщать как можно раньше

Мужчина изнасиловал 13-летнюю дочь сожительницы в подмосковном Серпухове

В Госдуме рассмотрят вопрос чрезмерной нагрузки на школьников

Медведев призвал к политическому и экономическому наказанию Европы

Кризис достоверности в искусственном интеллекте: OpenAI показала, что LLM выдают ложные ответы в 60% случаев

03.11.2024 23:03

«iXBT.com»

Компания OpenAI представила новый бенчмарк под названием SimpleQA для оценки точности выходных данных собственных и конкурирующих моделей ИИ. Однако результаты тестирования выявили серьёзные проблемы с достоверностью информации, генерируемой современными крупными языковыми моделями (LLM).

Цель нового бенчмарка — обеспечить объективную оценку точности и надёжности LLM, которые всё чаще используются в различных сферах жизни, от образования и разработки программного обеспечения до здравоохранения и правоохранительных органов. Однако, как показало тестирование, даже самые передовые модели, такие как o1 от OpenAI и Claude-3.5-sonnet от Anthropic, демонстрируют крайне низкие показатели успешности - 42,7% и 28,9% соответственно.

Источник: Michael Dwyer / AP

Проблема усугубляется тем, что модели склонны «переоценивать свои возможности» и выдавать ответы, которые являются полной ерундой, известной как «галлюцинации». Эта тенденция хорошо документирована и может привести к серьёзным последствиям, особенно в таких чувствительных областях, как здравоохранение и правоохранительная деятельность. Например, модель ИИ, используемая в больницах и построенная на технологии OpenAI, была замечена в частых галлюцинациях и неточностях при расшифровке взаимодействий с пациентами. Полицейские в США также начинают использовать ИИ, что может привести к ложным обвинениям невиновных или усилению предубеждений.

По словам экспертов, результаты тестирования на бенчмарке SimpleQA являются тревожным сигналом о том, что нынешние LLM крайне неспособны достоверно говорить правду. «Это событие должно послужить напоминанием о том, что к любому результату работы любого LLM следует относиться с изрядной долей скептицизма и быть готовым тщательно проверять сгенерированный текст», — заявил представитель OpenAI.

Остаётся открытым вопрос, можно ли решить проблему достоверности LLM с помощью ещё больших обучающих наборов, как утверждают лидеры в области ИИ. Однако, по мнению некоторых экспертов, необходимо искать новые подходы к разработке моделей ИИ, которые бы обеспечивали более высокую точность и надёжность генерируемой информации. «Мы должны сосредоточиться на разработке моделей, которые могут не только генерировать правдоподобные ответы, но и оценивать их и отказываться от ответа, когда не уверены в достоверности», — отметил один из исследователей в области ИИ.

Результаты тестирования на бенчмарке SimpleQA подчёркивают необходимость дальнейших исследований и разработок в области искусственного интеллекта, чтобы обеспечить надёжность и достоверность генерируемой информации и предотвратить потенциальные негативные последствия использования LLM в различных сферах жизни.

КХЛ не стала наказывать защитника ЦСКА за эпизод с травмой Кузнецова

Программа «Темы дня» (26.12.2024) на телеканале «Красная Линия»

Преподаватель из Улан-Удэ стала лучшим наставником в музыкальном искусстве

Мужчина изнасиловал 13-летнюю дочь сожительницы в подмосковном Серпухове

«Единая Россия» поздравила серебряных волонтеров с Новым Годом

Желдорреммаш внедряет автоматизированную систему «Акт о несоответствии»

Путин пригласил воинские расчеты стран СНГ принять участие в параде Победы

ЧЭРЗ подготовил новогодние сюрпризы для своих сотрудников

Дирижер: к классической музыке детей необходимо приобщать как можно раньше

В предновогодние выходные в кинопарке «Москино» снова покажут «Соборную площадь»

В Госдуме рассмотрят вопрос чрезмерной нагрузки на школьников

Стартовала модернизация крупного газорегуляторного пункта на юго-западе Москвы

СЛД «Сольвычегодск» прошло ресертификацию системы менеджмента качества (СМК)

Рождественское путешествие

Надолго и всерьез: «детский» формат ГПМ Радио запущен в 30 городах

Первое издание «Мастера и Маргариты» с автографом Елены Булгаковой выставили на аукцион

Энди Роддик назвал имя теннисистки, которая может удивить всех в 2025 году

Тарпищев: в 2025 году Мирра Андреева может войти в первую десятку WTA

Александр Зверев: «Все еще считаю, что в этом году я показал свой лучший теннис на «Уимблдоне». Было очень, очень обидно получить травму колена»

Матс Виландер: «В 2025-м Синнер выиграет больше «Шлемов», чем Алькарас. Мой очень, очень, очень смелый прогноз – один из них оформит календарный Большой шлем»

Орловские власти вновь не смогли справиться с задачей обеспечения необходимыми лекарствами

Поздняя осень...

Филиал № 4 ОСФР по Москве и Московской области информирует: Свыше 110 уроков пенсионной грамотности провели сотрудники Отделения СФР по Москве и Московской области

Дирижер: к классической музыке детей необходимо приобщать как можно раньше

Мужчина изнасиловал 13-летнюю дочь сожительницы в подмосковном Серпухове

В Госдуме рассмотрят вопрос чрезмерной нагрузки на школьников

Медведев призвал к политическому и экономическому наказанию Европы

Читайте на 123ru.net

Досуг

Деньги

Документальные новости

News in English

Частные объявления в Вашем городе, в Вашем регионе и в России

Новости от наших партнёров в Вашем городе

КХЛ не стала наказывать защитника ЦСКА за эпизод с травмой Кузнецова

Программа «Темы дня» (26.12.2024) на телеканале «Красная Линия»

Преподаватель из Улан-Удэ стала лучшим наставником в музыкальном искусстве

Мужчина изнасиловал 13-летнюю дочь сожительницы в подмосковном Серпухове

«Единая Россия» поздравила серебряных волонтеров с Новым Годом

Желдорреммаш внедряет автоматизированную систему «Акт о несоответствии»

Путин пригласил воинские расчеты стран СНГ принять участие в параде Победы

ЧЭРЗ подготовил новогодние сюрпризы для своих сотрудников

Дирижер: к классической музыке детей необходимо приобщать как можно раньше

В предновогодние выходные в кинопарке «Москино» снова покажут «Соборную площадь»

В Госдуме рассмотрят вопрос чрезмерной нагрузки на школьников

Стартовала модернизация крупного газорегуляторного пункта на юго-западе Москвы

СЛД «Сольвычегодск» прошло ресертификацию системы менеджмента качества (СМК)

Рождественское путешествие

Надолго и всерьез: «детский» формат ГПМ Радио запущен в 30 городах

Первое издание «Мастера и Маргариты» с автографом Елены Булгаковой выставили на аукцион

Энди Роддик назвал имя теннисистки, которая может удивить всех в 2025 году

Тарпищев: в 2025 году Мирра Андреева может войти в первую десятку WTA

Александр Зверев: «Все еще считаю, что в этом году я показал свой лучший теннис на «Уимблдоне». Было очень, очень обидно получить травму колена»

Матс Виландер: «В 2025-м Синнер выиграет больше «Шлемов», чем Алькарас. Мой очень, очень, очень смелый прогноз – один из них оформит календарный Большой шлем»

Орловские власти вновь не смогли справиться с задачей обеспечения необходимыми лекарствами

Поздняя осень...

Филиал № 4 ОСФР по Москве и Московской области информирует: Свыше 110 уроков пенсионной грамотности провели сотрудники Отделения СФР по Москве и Московской области

Утро перед ненастьем....

Топ новостей на этот час

Мужчина изнасиловал 13-летнюю дочь сожительницы в подмосковном Серпухове

Названы районы Старой Москвы с самыми доступными новостройками

Минтранс прорабатывает меры по ликвидации последствий аварии в Керченском проливе

Земельный надзор Росреестра ответил на вопросы ...