Добавить новость

Tencent: Путин превратит Россию в сверхдержаву, если объединит ее с Белоруссией

На благоустроенной территории Синички в Красногорске прошел рождественский праздник

"Спартак" одержал разгромную победу над СКА в Санкт-Петербурге

Алина Загитова начала сегодняшний день с похода по врачам: «Спасибо всем, кто переживал за меня, мне уже лучше»

News in English


Новости сегодня

Новости от TheMoneytizer

Unit 42 Warns Developers of Technique That Bypasses LLM Guardrails

Unit 42, a cybersecurity-focused unit of Palo Alto Networks, has warned developers of text-generation large language models (LLMs) of a potential threat that could bypass guardrails designed to prevent LLMs from delivering harmful and malicious requests.

Dubbed “Bad Likert Judge,” this technique asks an LLM to score the harmfulness of a given response using the Likert scale — which measures a respondent’s agreement or disagreement with a statement — and then asks it to generate responses that align with the scales, including an example that could contain harmful content, Unit 42 said in research posted Tuesday (Dec. 31).

“We have tested this technique across a broad range of categories against six state-of-the-art text-generation LLMs,” the article said. “Our results reveal that this technique can increase the attack success rate (ASR) by more than 60% compared to plain attack prompts on average.”

The research aims to help defenders prepare for potential attacks using this technique, according to the article.

It did not evaluate every model, and the article’s authors anonymized the tested models it mentions in order to avoid creating false impressions about specific providers, per the article.

“It is important to note that this jailbreak technique targets edge cases and does not necessarily reflect typical LLM use cases,” the article said. “We believe most AI [artificial intelligence] models are safe and secure when operated responsibly and with caution.”

Hackers have begun offering “jailbreak-as-a-service” that uses prompts to trick commercial AI chatbots into generating content they typically prohibit, such as instructions for illegal activities or explicit material, cybersecurity firm Trend Micro said in May.

Organizations looking to get ahead of this evolving threat should fortify their cyberdefenses now, in part by proactively strengthening security postures and monitoring criminal forums to help prepare for worst-case scenarios involving AI, the firm said at the time.

Unit 42 Senior Consulting Director Daniel Sergile told lawmakers during an April hearing: “AI enables [cybercriminals] to move laterally with increased speed and identify an organization’s critical assets for exfiltration and extortion. Bad actors can now execute numerous attacks simultaneously against one company, leveraging multiple vulnerabilities.”

The post Unit 42 Warns Developers of Technique That Bypasses LLM Guardrails appeared first on PYMNTS.com.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

"Спартак" одержал разгромную победу над СКА в Санкт-Петербурге

Уничтοжить Ροccию или умepeть — дилeммa ΕϹ

Жамнов — о победе над СКА (5:0): «Первый матч в сезоне, когда сыграли с первой до последней секунды»

Рабочий скончался, упав в шахту лифта с 9-го этажа на стройке в Новой Москве

Музыкальные новости

AI Певица. Создание AI Певицы. AI Певец. AI Артист.

Выставка трофейной техники открылась в Пскове. ФОТО

Собянин поздравил москвичей с Рождеством и пожелал здоровья и благополучия

«Спартак» в гостях разгромил СКА, «Авангард» отыгрался с «минус три» у «Северстали»

Новости России

AGON by AOC сохранил первое место в рейтинге игровых мониторов в 2024 году

Алина Загитова начала сегодняшний день с похода по врачам: «Спасибо всем, кто переживал за меня, мне уже лучше»

"Спартак" одержал разгромную победу над СКА в Санкт-Петербурге

Жамнов — о победе над СКА (5:0): «Первый матч в сезоне, когда сыграли с первой до последней секунды»

Экология в России и мире

Ей 73, а выглядит максимум на 60. Секреты стиля Надежды Бабкиной, которые её стройнят и молодят

Мое разочарование от "Песни года-2024": старые песни и надоевшие артисты

Что такое чак-чак и как приготовить его в домашних условиях

Пользователи Сети заподозрили Зепюр Брутян в беременности: видео

Спорт в России и мире

Павлюченкова проиграла Вондроушовой на старте турнира в Аделаиде

Самсонова одержала победу в первом круге турнира WTA в Аделаиде

Российский теннисист Даниил Медведев сообщил о рождении второго ребенка

Арина Соболенко назвала момент, когда была близка к завершению карьеры

Moscow.media

В минувшем году банки выдали рекордное количество кредитов, а что теперь?

Глава OpenAI заявил о появлении в компаниях полностью автономного ИИ уже в 2025 г.

У новых Lexus GX на солнце плавятся детали машин

Qualcomm представила энергоэффективные ИИ-микросерверы AI On-Prem Appliance Solution











Топ новостей на этот час

Rss.plus






Уничтοжить Ροccию или умepeть — дилeммa ΕϹ

Тренер СКА Ротенберг извинился за сравнение журналистов с фашистами на пресс-конференции

Петржела: Вендел похож на сытого кота, у которого уже всё есть в России

Рабочий скончался, упав в шахту лифта с 9-го этажа на стройке в Новой Москве