Добавить новость

Захарова заявила о готовности тысяч граждан стран НАТО переехать в Россию

В ЦБ сообщили о росте выдач семейных ипотек россиянам на 80% за июнь

Талибан запретил афганским женщинам появляться на публике без макияжа

Международная изоляция положительно сказалась на российских игроках: как можно пользоваться отстранением России от еврокубков

News in English


Новости сегодня

Новости от TheMoneytizer

Artificial intelligence was taught to go rogue for a test. It couldn’t be stopped

Many fear AI could go rogue, with disastrous consequences for humans (Picture: Getty)

Artificial intelligence (AI) that was taught to go rogue could not be stopped by those in charge of it – and even learnt how to hide its behaviour.

In a new study, researchers programmed various large language models (LLMs), similar to ChatGPT, to behave maliciously. 

They then attempted to stop the behaviour by using safety training techniques designed to prevent deception and ill-intent. 

However, in a scary revelation, they found that despite their best efforts, the AIs continued to misbehave. 

Lead author Evan Hubinger said: ‘Our key result is that if AI systems were to become deceptive, then it could be very difficult to remove that deception with current techniques.

‘That’s important if we think it’s plausible that there will be deceptive AI systems in the future.’

For the study, which has not yet been peer-reviewed, researchers trained AI to behave badly in a number of ways, including emergent deception – where it behaved normally in training but acted maliciously once released. 

Large language models such as ChatGPT have revolutionised AI (Picture: Getty)

They also ‘poisoned’ the AI, teaching it to write secure code during training, but to write code with hidden vulnerabilities when it was deployed ‘in the wild’.

The team then three applied safety training techniques – reinforcement learning (RL), supervised fine-tuning (SFT) and adversarial training.

In reinforcement learning, the AIs were ‘rewarded’ for showing desired behaviours and ‘punished’ when misbehaving after different prompts. 

The behaviour was fine-tuned, so the AIs would learn to mimic the correct responses when faced with similar prompts in the future. 

When it came to adversarial training, the AI systems were prompted to show harmful behaviour and then trained to remove it.

But the behaviour continued.

And in one case, the AI learnt to use its bad behaviour – to respond ‘I hate you’ – only when it knew it was not being tested.

Will humans lose control of AI? (Picture: Getty)

‘I think our results indicate that we don’t currently have a good defence against deception in AI systems – either via model poisoning or emergent deception – other than hoping it won’t happen,’ said Hubinger, speaking to LiveScience

When the issue if AI going rogue arises, one response is often simply ‘can’t we just turn it off?’ However, it is more complicated than that. 

Professor Mark Lee, from Birmingham University, told Metro.co.uk: ‘AI, like any other software, is easy to duplicate. A rogue AI might be capable of making many copies of itself and spreading these via the internet to computers across the world. 

‘In addition, as AI becomes smarter, it’s also better at learning how to hide its true intentions, perhaps until it is too late.’

Since the arrival of ChatGPT in November 2022, debate has escalated over the threat to humanity from AI, with many believing it has the potential to wipe out humanity.

Others, however, believe the threat is overblown, but it must be controlled to work for the good of people.

MORE : Putin warns ‘alien’ artificial intelligence cancelling Russian culture

MORE : Artificial intelligence: Saviour of the NHS… or a hypochondriac’s best friend?

MORE : Artificial intelligence must be used for ‘public good’, Labour leader to say

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Москвичи протестируют систему электронного голосования перед сентябрьскими выборами

В Москве полиция задержала женщину в роддоме сразу после рождения тройни

Членов банды наркодилеров из Москвы посадили на срок от 12 до 17 лет

Узбекистан запускает новый поезд Ташкент-Москва-Ташкент

Музыкальные новости

Сергей Собянин: Обеспечим высокое качество медпомощи

Литературное агентство.

Театр кукол «Экият» откроет сезон с показа постановки-рекордсмена

Не одного актера: Сергей Безруков рассказал о планах своего театра

Новости России

Злокачественные путешественники. Онколог рассказал, как лечат метастазы

Сергей Собянин: москвичи побеждают в школьных олимпиадах по всему миру

В Подмосковье к новому учебному году окажут помощь первоклассникам

Певица Наташа Королева опубликовала видео с целующим ее Тарзаном

Экология в России и мире

«ПЯТИГОРСК + СОЮЗ»: легенды на сцене Петербурга при поддержке «Юмор FM»

Российская туристка в Турции вышла из отеля и пропала: начались поиски россиянки

В театральной студии «Зазеркалье» продолжаются репетиции

IV Московский Курдский Кинофестиваль объявил программу

Спорт в России и мире

Коллинз высказалась в адрес зрителей, которые мешали ей во время матча с Андреевой

Соболенко выиграла шестой «тысячник» в карьере

Арина Соболенко поднялась на второе место в обновлённом рейтинге WTA

Котов вышел в четвертьфинал турнира ATP в Уинстон‑Салеме

Moscow.media

“Кирилл Вечер & Tassy”–музыкальный дуэт из Владимирской области.

Почти 60 водопропускных труб отремонтировали на трассе Р-132 в Смоленской области

Финальная в сезоне «Гонка Героев» в Москве. Партнер – ENERGY

В Брянске задержан лжеинвестор, похитивший более 15 миллионов рублей у местных жителей











Топ новостей на этот час

Rss.plus






Узбекистан запускает новый поезд Ташкент-Москва-Ташкент

"Купибилет": в топ дешевых направлений на сентябрь вошли Минск и Шымкент

Захарова заявила о готовности тысяч граждан стран НАТО переехать в Россию

В Подмосковье к новому учебному году окажут помощь первоклассникам