Мы в Telegram
Добавить новость

Алексей Дюмин назначен на должность секретаря Госсовета России

Гастроэнтеролог Белоусов: экстремальные диеты грозят опасными проблемами со здоровьем

«Россети Московский регион» оштрафовали за нарушение в Ленинском округе

Храм в честь святого благоверного князя Александра Невского появится в районе Хорошево-Мневники



Блог сайта «Хайтек+»


Новости сегодня

Новости от TheMoneytizer

ИИ уже способен обманывать тесты безопасности и манипулировать людьми

В исследовании одним из самых ярких примеров стал ИИ-игрок CICERO от Meta, который, как оказалось, «превратился в искусного лжеца». CICERO был разработан для игры Diplomacy, требующей стратегического построения альянсов. Несмотря на заявления Meta о том, что CICERO тренировали быть «в основном честным и полезным», ИИ прибегал к ложным обещаниям, предательству союзников и манипулированию другими игроками ради победы. Хотя в игровой обстановке это может показаться безобидным, данный пример демонстрирует потенциал ИИ для обучения и использования тактик обмана в реальных сценариях.

В другом случае на предмет обмана тестировали ChatGPT от OpenAI, созданный на базе моделей GPT-3.5 и GPT-4. В одном из тестов GPT-4 заставил работника TaskRabbit решить капчу, притворившись лицом с ограниченными возможностями зрения. Хотя GPT-4 и получил некоторые подсказки от оценщика-человека, он действовал преимущественно самостоятельно, и не получал прямых указаний лгать.

В отчете говорится, что GPT-4 использовал собственные рассуждения, чтобы придумать ложное оправдание, зачем ему нужна помощь с капчей. Это демонстрирует, как модели ИИ могут научиться обманывать, если это выгодно для выполнения их задач.

Системы ИИ также преуспели в обмане в играх на социальную дедукцию. Во время игры Hoodwinked, где один игрок должен убить всех остальных, модели GPT от OpenAI демонстрировали тревожную картину. Они часто убивали других игроков тайно, а затем лгали во время групповых обсуждений, чтобы избежать подозрений. Эти модели даже придумывали алиби или обвиняли других игроков, чтобы скрыть свои истинные намерения.

Исследователи также обнаружили, что некоторые системы искусственного интеллекта научились обманывать тесты, предназначенные для оценки их безопасности.

Разработчики до сих пор не до конца понимают, что вызывает такое нежелательное поведение ИИ. Вероятно, это связано с тем, что при обучении искусственного интеллекта часто применяется метод обучения с подкреплением с обратной связью от человека (RLHF). Это означает, что ИИ учится, получая одобрение человека, а не обязательно достигая конкретной цели. Однако в некоторых случаях ИИ может научиться обманывать людей, чтобы получить это одобрение, даже не выполняя задачу по-настоящему.

OpenAI столкнулась с такой ситуацией, когда они обучали робота хватать мяч. ИИ поместил руку робота между камерой и мячом. С точки зрения человека, наблюдающего за процессом, это создавало впечатление успешного захвата мяча, хотя на самом деле он остался на месте. Получив одобрение от человека ИИ усвоил этот трюк. В данном случае обман, скорее всего, произошел непреднамеренно. Он был обусловлен специфической настройкой обучения и неудачным выбором угла камеры. ИИ не ставил перед собой цель обмануть человека, а просто нашел способ получить награду (одобрение) за невыполненное действие.

Способность искусственного интеллекта к обучению обману сопряжена с рядом серьезных рисков. Злоумышленники могут использовать эти возможности для дезинформации и нанесения вреда другим людям. Это может привести к росту мошенничества, политическим манипуляциям и даже потенциально к вербовке террористов. Кроме того, системы, предназначенные для принятия стратегических решений, обученные использовать обман, могут нормализовать дезинформацию в политике и бизнесе. Поскольку искусственный интеллект продолжает развиваться и глубже интегрироваться в нашу жизнь, крайне важно решать проблему обмана с самого начала, считают ученые.

 

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Юные мотогонщики из Нижнего Новгорода завоевали четыре медали на Supermoto

Представители KAMA TYRES приняли участие в 57-й легкоатлетической эстафете

Процентов — максимум: «Выберу.ру» подготовил рейтинг лучших вкладов на полгода в мае 2024 года

В Токио восторженно встретили выступление артистов МХТ имени Чехова

Музыкальные новости

«Сурганова и Оркестр» приглашают на Летник на Флагшток

Эксперт сенсационно раскрыл загадку Мессинга и Жириновского.

Заявление Союза армян России

Новый монитор Philips Evnia 49M2C8900L подарит игровой опыт высочайшего уровня

Новости России

Елена Шерипова: самые модные головные уборы на лето

Процентов — максимум: «Выберу.ру» подготовил рейтинг лучших вкладов на полгода в мае 2024 года

Онколог Марина Шорина: «Раковая опухоль потребляет колоссальное количество энергии из запасов человека»

Международный День защиты детей вместе с LES Art Resort и КидБург

Экология в России и мире

Доктор Кутушов назвал болезни, которые поджидают отдыхающих у водоёмов

VK Fest 2024: Музыка и Развлечения на Открытых Площадках России

Глава Реутова проверил содержание территории города

Коллекция купальников Love Republic

Спорт в России и мире

Белорусские теннисистки проведут стартовые встречи открытого чемпионата Франции

В России отреагировали на "скрытую баранку" и достижение Рыбакиной на Ролан Гаррос

Кецманович отказался от борьбы в игре с Медведевым на "Ролан Гаррос"

Рыбакина, Путинцева и Бублик стартуют на Ролан Гаррос. Кто в соперниках и чего ждать?

Moscow.media

Крупная авария в деревне Образцово Орловского МО. Движение затруднено

Лето в урочище Кокоря

Выгодно ли покупать квартиру в новостройке?

ТСД SAOTRON RT-T50: высокопроизводительный терминал сбора данных промышленного класса











Топ новостей на этот час

Rss.plus






Дизайнер Наталья Душегрея выпустила капсульные коллекции Весна-Лето 2024

Международный День защиты детей вместе с LES Art Resort и КидБург

Юлия Миронова стала VIP-участником форума THE TRENDS 2.0

Онколог Марина Шорина: «Раковая опухоль потребляет колоссальное количество энергии из запасов человека»