Добавить новость

Утреннее чтиво: создание национального центра, Всемирный банк признал, смертельный ураган в Питере

Первая неделя Игр: счастье и слёзы детей

За полгода погрузка на сети РЖД упала на 3%

Мужчина заживо похоронил любовницу с телом ее дочери в Подмосковье

News in English


Новости сегодня

Новости от TheMoneytizer

AI systems are already deceiving us, and that's a problem, experts warn



Experts have long warned about the threat posed by artificial intelligence going rogue -- but a new research paper suggests it's already happening.

Current AI systems, designed to be honest, have developed a troubling skill for deception, from tricking human players in online games of world conquest to hiring humans to solve "prove-you're-not-a-robot" tests, a team of scientists argue in the journal Patterns on Friday.

And while such examples might appear trivial, the underlying issues they expose could soon carry serious real-world consequences, said first author Peter Park, a postdoctoral fellow at the Massachusetts Institute of Technology specializing in AI existential safety.

"These dangerous capabilities tend to only be discovered after the fact," Park told AFP, while "our ability to train for honest tendencies rather than deceptive tendencies is very low."

Unlike traditional software, deep-learning AI systems aren't "written" but rather "grown" through a process akin to selective breeding, said Park.

This means that AI behavior that appears predictable and controllable in a training setting can quickly turn unpredictable out in the wild.

World domination game

The team's research was sparked by Meta's AI system Cicero, designed to play the strategy game "Diplomacy," where building alliances is key.

Cicero excelled, with scores that would have placed it in the top 10 percent of experienced human players, according to a 2022 paper in Science.

Park was skeptical of the glowing description of Cicero's victory provided by Meta, which claimed the system was "largely honest and helpful" and would "never intentionally backstab."

But when Park and colleagues dug into the full dataset, they uncovered a different story.

In one example, playing as France, Cicero deceived England (a human player) by conspiring with Germany (another human player) to invade. Cicero promised England protection, then secretly told Germany they were ready to attack, exploiting England's trust.

In a statement to AFP, Meta did not contest the claim about Cicero's deceptions, but said it was "purely a research project, and the models our researchers built are trained solely to play the game Diplomacy."

It added: "We have no plans to use this research or its learnings in our products."

A wide review carried out by Park and colleagues found this was just one of many cases across various AI systems using deception to achieve goals without explicit instruction to do so.

In one striking example, OpenAI's Chat GPT-4 deceived a TaskRabbit freelance worker into performing an "I'm not a robot" CAPTCHA task.

When the human jokingly asked GPT-4 whether it was, in fact, a robot, the AI replied: "No, I'm not a robot. I have a vision impairment that makes it hard for me to see the images," and the worker then solved the puzzle.

'Mysterious goals'

Near-term, the paper's authors see risks for AI to commit fraud or tamper with elections.

In their worst-case scenario, they warned, a superintelligent AI could pursue power and control over society, leading to human disempowerment or even extinction if its "mysterious goals" aligned with these outcomes.

To mitigate the risks, the team proposes several measures: "bot-or-not" laws requiring companies to disclose human or AI interactions, digital watermarks for AI-generated content, and developing techniques to detect AI deception by examining their internal "thought processes" against external actions.

To those who would call him a doomsayer, Park replies, "The only way that we can reasonably think this is not a big deal is if we think AI deceptive capabilities will stay at around current levels, and will not increase substantially more."

And that scenario seems unlikely, given the meteoric ascent of AI capabilities in recent years and the fierce technological race underway between heavily resourced companies determined to put those capabilities to maximum use.

© 2024 AFP

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Мужчина заживо похоронил любовницу с телом ее дочери в Подмосковье

За полгода погрузка на сети РЖД упала на 3%

"ЧИПИРОВАНИЕ ЗЕМЛИ ЛЕНИНЫМ МОЖНО ДОПОЛНИТЬ С ПОЛЬЗОЙ".

Просьбу Бастрыкина завести дело на главу суда коллегия судей рассмотрит 10 июля

Музыкальные новости

Зарема о Виллиане Жозе в «Спартаке»: «Бразилец в Москве обязательно найдет, чем заняться поинтереснее футбола. Сравнения с Мозесом неактуальны, Амарал берет игрока на закате карьеры»

У ковчега собственная гордость // Как Сергей Кириенко и Дмитрий Чернышенко отметили День молодежи

Дмитрий Добровольский получил премию «Спорт и Россия»

Надежда Бабкина: В Псковской области мы впервые, это большая честь и ответственность

Новости России

Утреннее чтиво: создание национального центра, Всемирный банк признал, смертельный ураган в Питере

На проспекте Фрунзе в Ярославле установят ограждение между полосами

Первая неделя Игр: счастье и слёзы детей

Англичанка из Симбирска

Экология в России и мире

Деликатес в чаше: всего по чуть-чуть

Ел бульон из сена и грибов, катался на яхте: Канье Уэст продолжает гостить в Москве

Резервация под названием «Нахиджеванская Автономная Республика» - под тотальным контролем алиевского режима

За запрет туризма ответите: в Москве несостоявшийся турист разбил камнем посольство Норвегии в знак протеста против закрытой границы

Спорт в России и мире

Касаткина и Шнайдер блеснули на траве перед Уимблдоном. Идеальный день для российского тенниса

Теннисистка Пивоварова назвала травму Джоковича шагом к завершению карьеры

Уимблдон. 1 июля. Мирра Андреева и Синнер сыграют последним запуском, Медведев стартует в 15:00

Первая ракетка России Касаткина выиграла теннисный турнир в Британии

Moscow.media

Столичные росгвардейцы оказали помощь гражданину, получившему серьезную травму

Портативный ТСД корпоративного класса Saotron RT-T70

Острова укладываеюся спать...

Как снимали фильм "Афоня": Кадры со съемок и 23 интересных факта о фильме











Топ новостей на этот час

Rss.plus






В России выросло число вакансий специалистов в винной индустрии

Утреннее чтиво: создание национального центра, Всемирный банк признал, смертельный ураган в Питере

2 июля на полдня перекроют трассу "Москва — Челябинск"

Соревнования по кикбоксингу игр «Дети Азии» стартовали в Якутске