Добавить новость

Ранее судимого мужчину задержали за попытку украсть 3,8 млн руб. с баковского счета умершей москвички

Российского депутата обвинили в попавшем на видео пьяном дебоше в подъезде

Суд отправил экс-главу Рязанской области Любимова в СИЗО по делу о взятке

Эксперт рассказал о смартфонах, которые взрываются чаще всего



News in English


Новости сегодня

Новости от TheMoneytizer

Which AI Companies Are the Safest—and Least Safe?

As companies race to build more powerful AI, safety measures are being left behind. A report published Wednesday takes a closer look at how companies including OpenAI and Google DeepMind are grappling with the potential harms of their technology. It paints a worrying picture: flagship models from all the developers in the report were found to have vulnerabilities, and some companies have taken steps to enhance safety, others lag dangerously behind. 

The report was published by the Future of Life Institute, a nonprofit that aims to reduce global catastrophic risks. The organization’s 2023 open letter calling for a pause on large-scale AI model training drew unprecedented support from 30,000 signatories, including some of technology’s most prominent voices. For the report, the Future of Life Institute brought together a panel of seven independent experts—including Turing Award winner Yoshua Bengio and Sneha Revanur from Encode Justice—who evaluated technology companies across six key areas: risk assessment, current harms, safety frameworks, existential safety strategy, governance & accountability, and transparency & communication. Their review considered a range of potential harms, from carbon emissions to the risk of an AI system going rogue. 

[time-brightcove not-tgx=”true”]

“The findings of the AI Safety Index project suggest that although there is a lot of activity at AI companies that goes under the heading of ‘safety,’ it is not yet very effective,” said Stuart Russell, a professor of computer science at University of California, Berkeley and one of the panelists, in a statement. 

Read more: No One Truly Knows How AI Systems Work. A New Discovery Could Change That

Despite touting its “responsible” approach to AI development, Meta, Facebook’s parent company, and developer of the popular Llama series of AI models, was rated the lowest, scoring a F-grade overall. X.AI, Elon Musk’s AI company, also fared poorly, receiving a D- grade overall. Neither Meta nor x.AI responded to a request for comment. 

The company behind ChatGPT, OpenAI—which early in the year was accused of prioritizing “shiny products” over safety by the former leader of one of its safety teams—received a D+, as did Google DeepMind. Neither company responded to a request for comment. Zhipu AI, the only Chinese AI developer to sign a commitment to AI safety during the Seoul AI Summit in May, was rated D overall. Zhipu could not be reached for comment.

Anthropic, the company behind the popular chatbot Claude, which has made safety a core part of its ethos, ranked the highest. Even still, the company received a C grade, highlighting that there is room for improvement among even the industry’s safest players. Anthropic did not respond to a request for comment.

In particular, the report found that all of the flagship models evaluated were found to be vulnerable to “jailbreaks,” or techniques that override the system guardrails. Moreover, the review panel deemed the current strategies of all companies inadequate for ensuring that hypothetical future AI systems which rival human intelligence remain safe and under human control.

Read more: Inside Anthropic, the AI Company Betting That Safety Can Be a Winning Strategy

“I think it’s very easy to be misled by having good intentions if nobody’s holding you accountable,” says Tegan Maharaj, assistant professor in the department of decision sciences at HEC Montréal, who served on the panel. Maharaj adds that she believes there is a need for “independent oversight,” as opposed to relying solely on companies to conduct in-house evaluations. 

There are some examples of “low-hanging fruit,” says Maharaj, or relatively simple actions by some developers to marginally improve their technology’s safety. “Some companies are not even doing the basics,” she adds. For example, Zhipu AI, x.AI, and Meta, which each rated poorly on risk assessments, could adopt existing guidelines, she argues. 

However, other risks are more fundamental to the way AI models are currently produced, and overcoming them will require technical breakthroughs. “None of the current activity provides any kind of quantitative guarantee of safety; nor does it seem possible to provide such guarantees given the current approach to AI via giant black boxes trained on unimaginably vast quantities of data,” Russell said. “And it’s only going to get harder as these AI systems get bigger.” Researchers are studying techniques to peer inside the black box of machine learning models.

In a statement, Bengio, who is the founder and scientific director for Montreal Institute for Learning Algorithms, underscored the importance of initiatives like the AI Safety Index. “They are an essential step in holding firms accountable for their safety commitments and can help highlight emerging best practices and encourage competitors to adopt more responsible approaches,” he said.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Москва: Новые квартиры для 3 тысяч жителей благодаря программе реновации

Американский защитник «Ак Барса» ответил на вопрос о стереотипах касательно России

Ивлеевой отказали в апелляции по делу о дискредитации ВС России

Картину Ильи Репина выставят на торги за несколько десятков миллионов

Музыкальные новости

В дни школьных каникул балет «Щелкунчик» пройдет в «Колизей - арене»

Купить качественный частотный преобразователь в России

ОМОН «ОРИОН» ПРЕДОТВРАТИЛ ТЕРАКТ В КАЛУГЕ: ВИНОВНЫЙ ПОЛУЧИЛ 16 ЛЕТ СТРОГОГО РЕЖИМА

В подмосковном Щелково сотрудники Росгвардии задержали подозреваемого в краже верхней одежды из гипермаркета

Новости России

Ивлеевой отказали в апелляции по делу о дискредитации ВС России

До июля 2025 года: Путин продлил запрет на продажу нефти по потолку цен

Просивший 10 миллионов рублей за возбуждение дела российский полицейский получил срок

Источник 360.ru: на Кутузовском проспекте в Москве произошло ДТП

Экология в России и мире

Termit представил амбассадоров бренда

Международный конкурс искусства «Сокровища нации» 2024

Международный конкурс искусства «Сокровища нации» 2024

5 способов, как сделать освещение умным

Спорт в России и мире

WTA назвала белоруску Соболенко лучшей теннисисткой года

Раскрыта неожиданная причина превосходства молодой теннисистки над Еленой Рыбакиной

Новак Джокович заявился на турнир ATP-500 в Дохе

Видео дня: Мария Шарапова учит сына русскому алфавиту

Moscow.media

BelkaCar и МТС Premium увеличили кэшбэк на поездки в приложении каршеринга

Филиал № 4 ОСФР по Москве и Московской области информирует: В 2024 году Отделение СФР по Москве и Московской области назначило единое пособие родителям 370,5 тысячи детей

BelkaCar и МТС Premium увеличили кэшбэк на поездки в приложении каршеринга

Портативный ТСД корпоративного класса Saotron RT-T70











Топ новостей на этот час

Rss.plus






Картину Ильи Репина выставят на торги за несколько десятков миллионов

Рефтинцу вручили медаль Жукова

Циркулирующее предложение: ключевая метрика криптовалютного рынка

Ивлеевой отказали в апелляции по делу о дискредитации ВС России