Добавить новость

Три парковки со шлагбаумом временно закроются на переобустройство

Инвесторы помогают отреставрировать памятные здания в Москве

SHOT: жительница Перми рассказала, что убила сына из-за коллекторов

Певица Рымбаева объяснила свой внешний вид хорошей генетикой





Новости сегодня

Новости от TheMoneytizer

ИИ уже способен обманывать тесты безопасности и манипулировать людьми

В исследовании одним из самых ярких примеров стал ИИ-игрок CICERO от Meta, который, как оказалось, «превратился в искусного лжеца». CICERO был разработан для игры Diplomacy, требующей стратегического построения альянсов. Несмотря на заявления Meta о том, что CICERO тренировали быть «в основном честным и полезным», ИИ прибегал к ложным обещаниям, предательству союзников и манипулированию другими игроками ради победы. Хотя в игровой обстановке это может показаться безобидным, данный пример демонстрирует потенциал ИИ для обучения и использования тактик обмана в реальных сценариях.

В другом случае на предмет обмана тестировали ChatGPT от OpenAI, созданный на базе моделей GPT-3.5 и GPT-4. В одном из тестов GPT-4 заставил работника TaskRabbit решить капчу, притворившись лицом с ограниченными возможностями зрения. Хотя GPT-4 и получил некоторые подсказки от оценщика-человека, он действовал преимущественно самостоятельно, и не получал прямых указаний лгать.

В отчете говорится, что GPT-4 использовал собственные рассуждения, чтобы придумать ложное оправдание, зачем ему нужна помощь с капчей. Это демонстрирует, как модели ИИ могут научиться обманывать, если это выгодно для выполнения их задач.

Системы ИИ также преуспели в обмане в играх на социальную дедукцию. Во время игры Hoodwinked, где один игрок должен убить всех остальных, модели GPT от OpenAI демонстрировали тревожную картину. Они часто убивали других игроков тайно, а затем лгали во время групповых обсуждений, чтобы избежать подозрений. Эти модели даже придумывали алиби или обвиняли других игроков, чтобы скрыть свои истинные намерения.

Исследователи также обнаружили, что некоторые системы искусственного интеллекта научились обманывать тесты, предназначенные для оценки их безопасности.

Разработчики до сих пор не до конца понимают, что вызывает такое нежелательное поведение ИИ. Вероятно, это связано с тем, что при обучении искусственного интеллекта часто применяется метод обучения с подкреплением с обратной связью от человека (RLHF). Это означает, что ИИ учится, получая одобрение человека, а не обязательно достигая конкретной цели. Однако в некоторых случаях ИИ может научиться обманывать людей, чтобы получить это одобрение, даже не выполняя задачу по-настоящему.

OpenAI столкнулась с такой ситуацией, когда они обучали робота хватать мяч. ИИ поместил руку робота между камерой и мячом. С точки зрения человека, наблюдающего за процессом, это создавало впечатление успешного захвата мяча, хотя на самом деле он остался на месте. Получив одобрение от человека ИИ усвоил этот трюк. В данном случае обман, скорее всего, произошел непреднамеренно. Он был обусловлен специфической настройкой обучения и неудачным выбором угла камеры. ИИ не ставил перед собой цель обмануть человека, а просто нашел способ получить награду (одобрение) за невыполненное действие.

Способность искусственного интеллекта к обучению обману сопряжена с рядом серьезных рисков. Злоумышленники могут использовать эти возможности для дезинформации и нанесения вреда другим людям. Это может привести к росту мошенничества, политическим манипуляциям и даже потенциально к вербовке террористов. Кроме того, системы, предназначенные для принятия стратегических решений, обученные использовать обман, могут нормализовать дезинформацию в политике и бизнесе. Поскольку искусственный интеллект продолжает развиваться и глубже интегрироваться в нашу жизнь, крайне важно решать проблему обмана с самого начала, считают ученые.

 

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Пловец из Истры Герман Зажирский победил на первенстве России

Продукцию российских фермеров представили на ярмарке в Новых Химках

Жители Пензенского района жалуются на открытие в доме второй алкоточки по соседству с «развивашкой»

Интервалы движения поездов по часовой стрелке увеличели на БКЛ

Музыкальные новости

Опубликован рейтинг упоминаемости губернаторов в Telegram каналах за июнь 2024 года

ГУАП отмечен благодарностью Минобрнауки РФ за внедрение программы «Обучение служением»

В Оренбургском филиале АО «Желдорреммаш» освоен ремонт нового оборудования для тепловозов «Витязь», работающих на БАМе

Катя Адушкина, AdrenalinHouse, Jazzdauren и другие артисты и блогеры зажгли на сцене Академии Игоря Крутого на VK Fest

Новости России

Интервалы движения поездов по часовой стрелке увеличели на БКЛ

Депутат Юлия Мамай провела прием жителей Химок по социальным вопросам

В Нижегородской области стартовал набор в школу медиаволонтеров при региональном Минпроме

Продукцию российских фермеров представили на ярмарке в Новых Химках

Экология в России и мире

Финалист шоу “Голос” Сергей Арутюнов остался без голоса. Артист находится в больнице, состояние тяжёлое.

«Из-за поездки на Бали я выглядела беременной и мне пришлось поехать в Грецию, чтобы это исправить» - туристка сообщила, что никогда больше не вернется на этот кошмарный остров

Инсульт: что нужно знать?

В СЛД «Абакан» филиала «Красноярский» компании «ЛокоТех-сервис» поступили новые электровозы 3ЭС5К

Спорт в России и мире

Российский теннисист Медведев рассказал о споре с судьей на Уимблдоне

Алькарас обратился к Джоковичу после финала Уимблдона

Олимпиаду в Париже не покажут по ТВ в России

Independent: Кейт Миддлтон посетила финал Уимблдона, несмотря на болезнь

Moscow.media

Из России с деньгами и любовью... к Западу. Высокопоставленные "слуги народа" массово бегут за границу

Летний туристический проект «Умные путешествия» запущен в Подмосковье

Болотные мотивы...

Каменный город











Топ новостей на этот час

Rss.plus






Пловец из Истры Герман Зажирский победил на первенстве России

Продукцию российских фермеров представили на ярмарке в Новых Химках

В Тюменской области завершился фестиваль «Лето в Тобольском кремле»

В Нижегородской области стартовал набор в школу медиаволонтеров при региональном Минпроме