Мы в Telegram
Добавить новость

50 дней без еды. Россиянин выжил после голодовки

Примани, венок, жениха богатого: какие народные гадания до сих популярны у россиян

Курьеры мошенников помогли «избавиться» от сбережений жительнице Приморья

КЧР. Ансамбль КЧГУ стал лауреатом фестиваля «Российская студенческая весна – 2023»



Новости сегодня

Новости от TheMoneytizer

AI systems are already deceiving us -- and that's a problem, experts warn

Washington (AFP) May 10, 2024 - Experts have long warned about the threat posed by artificial intelligence going rogue -- but a new research paper suggests it's already happening.

Current AI systems, designed to be honest, have developed a troubling skill for deception, from tricking human players in online games of world conquest to hiring humans to solve "prove-you're-not-a-robot" tests, a team of scientists argue in the journal Patterns on Friday.

And while such examples might appear trivial, the underlying issues they expose could soon carry serious real-world consequences, said first author Peter Park, a postdoctoral fellow at the Massachusetts Institute of Technology specializing in AI existential safety.

"These dangerous capabilities tend to only be discovered after the fact," Park told AFP, while "our ability to train for honest tendencies rather than deceptive tendencies is very low."

Unlike traditional software, deep-learning AI systems aren't "written" but rather "grown" through a process akin to selective breeding, said Park.

This means that AI behavior that appears predictable and controllable in a training setting can quickly turn unpredictable out in the wild.

- World domination game -

The team's research was sparked by Meta's AI system Cicero, designed to play the strategy game "Diplomacy," where building alliances is key.

Cicero excelled, with scores that would have placed it in the top 10 percent of experienced human players, according to a 2022 paper in Science.

Park was skeptical of the glowing description of Cicero's victory provided by Meta, which claimed the system was "largely honest and helpful" and would "never intentionally backstab."

But when Park and colleagues dug into the full dataset, they uncovered a different story.

In one example, playing as France, Cicero deceived England (a human player) by conspiring with Germany (another human player) to invade. Cicero promised England protection, then secretly told Germany they were ready to attack, exploiting England's trust.

In a statement to AFP, Meta did not contest the claim about Cicero's deceptions, but said it was "purely a research project, and the models our researchers built are trained solely to play the game Diplomacy."

It added: "We have no plans to use this research or its learnings in our products."

A wide review carried out by Park and colleagues found this was just one of many cases across various AI systems using deception to achieve goals without explicit instruction to do so.

In one striking example, OpenAI's Chat GPT-4 deceived a TaskRabbit freelance worker into performing an "I'm not a robot" CAPTCHA task.

When the human jokingly asked GPT-4 whether it was, in fact, a robot, the AI replied: "No, I'm not a robot. I have a vision impairment that makes it hard for me to see the images," and the worker then solved the puzzle.

- 'Mysterious goals' -

Near-term, the paper's authors see risks for AI to commit fraud or tamper with elections.

In their worst-case scenario, they warned, a superintelligent AI could pursue power and control over society, leading to human disempowerment or even extinction if its "mysterious goals" aligned with these outcomes.

To mitigate the risks, the team proposes several measures: "bot-or-not" laws requiring companies to disclose human or AI interactions, digital watermarks for AI-generated content, and developing techniques to detect AI deception by examining their internal "thought processes" against external actions.

To those who would call him a doomsayer, Park replies, "The only way that we can reasonably think this is not a big deal is if we think AI deceptive capabilities will stay at around current levels, and will not increase substantially more."

And that scenario seems unlikely, given the meteoric ascent of AI capabilities in recent years and the fierce technological race underway between heavily resourced companies determined to put those capabilities to maximum use.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Синоптики спрогнозировали еще один жаркий день с грозами в Москве 2 июня

50 дней без еды. Россиянин выжил после голодовки

Курьеры мошенников помогли «избавиться» от сбережений жительнице Приморья

Экономист Лобода напомнил россиянам о главном минусе рассрочки

Музыкальные новости

«Райский цветник» Бакиханова и азербайджанские фальсификации. ВИДЕО

ONYX отправляется в Большой тур по России

Дизайнер Наталья Душегрея выпустила капсульные коллекции Весна-Лето 2024

Тарасова - в инвалидном кресле, от Малахова - венок, Хазанов отмолчался: Кто пришёл на похороны Анастасии Заворотнюк

Новости России

КЧР. Ансамбль КЧГУ стал лауреатом фестиваля «Российская студенческая весна – 2023»

Гонщики «КАМАЗ-мастер» показали свое мастерство на фестивале Drift Expo

50 дней без еды. Россиянин выжил после голодовки

Курьеры мошенников помогли «избавиться» от сбережений жительнице Приморья

Экология в России и мире

AlfaBiom выпустили на рынок России БАД с красным ферментированным рисом

VK Fest 2024: Музыка и Развлечения на Открытых Площадках России

Волжский нарцисс - Плес

Представители KAMA TYRES приняли участие в 57-й легкоатлетической эстафете

Спорт в России и мире

Ролан Гаррос. Расписание 2 июня. Потапова и Швентек сыграют первым запуском, Синнер – последним

Бывшая российская теннисистка спела гимн Франции

Азаренко не смогла выйти в 1/16 финала открытого чемпионата Франции по теннису

Пресс-служба WTA мемом отреагировала на тяжёлую победу Свёнтек над Осакой

Moscow.media

Военные следователи продолжают оказывать гуманитарную помощь военнослужащим, находящимся в полевых госпиталях

Распределяй и управляй: водители «Грузовичкоф Бизнес» – о преимуществах работы и трудовых буднях  

Выгодно ли покупать квартиру в новостройке?

В Петербурге суд оправдал владельца транспортных средств, который давал взятки сотруднику ГИБДД











Топ новостей на этот час

Rss.plus






Авиалайнер из Москвы 2 июня прилетает во Владивосток с опережением графика

Какие астрономические явления туляки смогут увидеть в июне

50 дней без еды. Россиянин выжил после голодовки

Примани, венок, жениха богатого: какие народные гадания до сих популярны у россиян