Добавить новость

Лавров усомнился в демократичности парламентских выборов во Франции

Военкор Романов публично извинился за свои слова о подразделении «Ахмат»

Программа «Семья. Лето. Парк» прошла в Мытищах

В Подмосковье регоператор установил более 150 контейнеров





Новости сегодня

Новости от TheMoneytizer

AI Evaluation Initiative Could Boost Commercial Adoption

Anthropic’s new funding program for advanced artificial intelligence (AI) evaluations could accelerate the adoption of AI across various commercial sectors, industry experts say.  The AI company announced Tuesday it will fund third-party organizations to develop new methods for assessing AI capabilities and risks, addressing a critical gap in the rapidly evolving field. The initiative seeks […]

The post AI Evaluation Initiative Could Boost Commercial Adoption appeared first on PYMNTS.com.

Anthropic’s new funding program for advanced artificial intelligence (AI) evaluations could accelerate the adoption of AI across various commercial sectors, industry experts say. 

The AI company announced Tuesday it will fund third-party organizations to develop new methods for assessing AI capabilities and risks, addressing a critical gap in the rapidly evolving field.

The initiative seeks to create more robust benchmarks for complex AI applications, potentially unlocking billions in commercial value. As businesses look to deploy AI solutions, the lack of comprehensive evaluation tools has been a barrier to widespread adoption.

“We’re seeking evaluations that help us measure the AI Safety Levels (ASLs) defined in our Responsible Scaling Policy,” Anthropic stated in its announcement. These levels determine safety and security requirements for models with specific capabilities.

Checking for Threats

Key focus areas include assessments of AI models’ potential cybersecurity capabilities, such as vulnerability discovery and exploit development. The company also seeks “evaluations that assess two critical capabilities: a) the potential for models to significantly enhance the abilities of non-experts or experts in creating CBRN [chemical, biological, radiological and nuclear] threats, and b) the capacity to design novel, more harmful CBRN threats.”

The impact of this funding program is expected to be particularly significant for complex AI applications. “Straightforward applications like speech recognition already have decent benchmarks, but quantifying a model’s capability in assisting a crime is much more difficult,” Julija Bainiaksina, founder of the AI company MiniMe, told PYMNTS.

Improved benchmarks could address critical challenges in AI adoption for businesses. “The main problems of adapting generative AI at the moment are cost, hallucinations and safety,” Ilia Badeev, head of data science at Trevolution Group, told PYMNTS. “While the first is relatively predictable and controllable, the latter two are a pain and a breaking point for many projects and integrations.”

The initiative comes as significant tech companies race to develop increasingly powerful AI models, raising concerns about potential misuse. Anthropic, founded by former OpenAI researchers, has positioned itself as a “responsible” AI development leader.

“A robust, third-party evaluation ecosystem is essential for assessing AI capabilities and risks,” Anthropic emphasized. The company added that “developing high-quality, safety-relevant evaluations remains challenging, and the demand is outpacing the supply.”

What Makes a Good Evaluation?

Anthropic outlined several principles for good evaluations, including that they should be “sufficiently difficult” and “not in the training data.” The company stressed the importance of domain expertise: “If the evaluation is about expert performance on a particular subject matter (e.g., science), make sure to use subject matter experts to develop or review the evaluation.”

The company is accepting proposals through an online application form on a rolling basis. Its internal experts will work closely with selected teams to refine evaluation methods, noting that “refining an evaluation typically requires several iterations.”

Anthropic’s initiative could have far-reaching implications for the commercial AI landscape. By creating more reliable and comprehensive evaluation methods, businesses may gain the confidence to deploy AI solutions in critical areas such as healthcare, finance and customer service. This could potentially unlock productivity gains and new revenue streams across industries.

However, the success of this program will largely depend on the quality and relevance of the evaluations developed. If the new benchmarks fail to capture real-world scenarios adequately or are too narrowly focused, they may provide a false sense of security.

The challenge lies in creating rigorous evaluations to ensure safety and flexibility to keep pace with rapidly evolving AI capabilities. As the initiative unfolds, monitoring how well the resulting evaluations translate to practical commercial applications will be crucial.

For all PYMNTS AI coverage, subscribe to the daily AI Newsletter.

The post AI Evaluation Initiative Could Boost Commercial Adoption appeared first on PYMNTS.com.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Депутат Госдумы Милонов призвал ввести городской дресс-код при жаре

Суд восстановил адвокатский статус Коврижкина по делу Голунова

Москва запускает льготное кредитование инвесторов, строящих спортивные объекты

Итоги всероссийской военно-спортивной игры «Победа» подвели в Кубинке

Музыкальные новости

В ОМ Девелопмент рассказали, как рынок отреагирует на отмену льготной ипотеки

В Пулково из-за непогоды временно остановили вылеты самолетов

Составлен график приема москвичей по вопросам программы реновации в Общественном штабе в июле

Tele2 модернизировала сеть на транспортных узлах по всей России

Новости России

Еще 11 народных троп обустроили в Долгопрудном по просьбам жителей

Депутат Госдумы Милонов призвал ввести городской дресс-код при жаре

В Калязине на выходных Волга «вскипела» от спортивных страстей

Москва запускает льготное кредитование инвесторов, строящих спортивные объекты

Экология в России и мире

Новая художественная выставка откроется 9 июля в Реутове

Сам себе окулист. Как проверить зрение в домашних условиях?

Новые добрые стикеры от «585*ЗОЛОТОЙ» и фонда «Детская миссия» уже доступны в Telegram

Помощь в организации Презентации книги для Писателей и Поэтов в Книжных магазинах и других площадках

Спорт в России и мире

Первую ракетку мира решили утешить после сенсации от казахстанки на Уимблдоне

Теннисистки из Тольятти закончили выступление на турнире в Уимблдоне

Медведев пообещал выложиться на 100 процентов в матче Уимблдона с Синнером

Хачанов не смог выйти в третий круг Уимблдона, проиграв 220-й ракетке мира

Moscow.media

Новая Лада Ларгус — реальные цены у дилеров в июле 2024 года

70 человек отравились роллами в Бурятии

Tele2 модернизировала сеть на транспортных узлах по всей России

Ученые создали мышь с иммунитетом человека











Топ новостей на этот час

Rss.plus






Мужчина разбился насмерть об воду, прыгнув в карьер в Подмосковье

Москвичей поздравили с Днем семьи, любви и верности

Москва запускает льготное кредитование инвесторов, строящих спортивные объекты

В Префектуре ЮЗАО Москвы прошел праздничный концерт в преддверии Дня семьи, любви и верности