Добавить новость

«Золото» в пулевой стрельбе забрал юный талант из СФО

Развитие экосистемы непрерывного образования обсудили на Выставке “Россия”

Канал ТНТ объявляет о старте съемок нового спортивного шоу «Игры без границ»  

Бюллетень по требованию // В Москве принят новый порядок голосования на предстоящих выборах



Новости сегодня

Новости от TheMoneytizer

AI Evaluation Initiative Could Boost Commercial Adoption

Anthropic’s new funding program for advanced artificial intelligence (AI) evaluations could accelerate the adoption of AI across various commercial sectors, industry experts say.  The AI company announced Tuesday it will fund third-party organizations to develop new methods for assessing AI capabilities and risks, addressing a critical gap in the rapidly evolving field. The initiative seeks […]

The post AI Evaluation Initiative Could Boost Commercial Adoption appeared first on PYMNTS.com.

Anthropic’s new funding program for advanced artificial intelligence (AI) evaluations could accelerate the adoption of AI across various commercial sectors, industry experts say. 

The AI company announced Tuesday it will fund third-party organizations to develop new methods for assessing AI capabilities and risks, addressing a critical gap in the rapidly evolving field.

The initiative seeks to create more robust benchmarks for complex AI applications, potentially unlocking billions in commercial value. As businesses look to deploy AI solutions, the lack of comprehensive evaluation tools has been a barrier to widespread adoption.

“We’re seeking evaluations that help us measure the AI Safety Levels (ASLs) defined in our Responsible Scaling Policy,” Anthropic stated in its announcement. These levels determine safety and security requirements for models with specific capabilities.

Checking for Threats

Key focus areas include assessments of AI models’ potential cybersecurity capabilities, such as vulnerability discovery and exploit development. The company also seeks “evaluations that assess two critical capabilities: a) the potential for models to significantly enhance the abilities of non-experts or experts in creating CBRN [chemical, biological, radiological and nuclear] threats, and b) the capacity to design novel, more harmful CBRN threats.”

The impact of this funding program is expected to be particularly significant for complex AI applications. “Straightforward applications like speech recognition already have decent benchmarks, but quantifying a model’s capability in assisting a crime is much more difficult,” Julija Bainiaksina, founder of the AI company MiniMe, told PYMNTS.

Improved benchmarks could address critical challenges in AI adoption for businesses. “The main problems of adapting generative AI at the moment are cost, hallucinations and safety,” Ilia Badeev, head of data science at Trevolution Group, told PYMNTS. “While the first is relatively predictable and controllable, the latter two are a pain and a breaking point for many projects and integrations.”

The initiative comes as significant tech companies race to develop increasingly powerful AI models, raising concerns about potential misuse. Anthropic, founded by former OpenAI researchers, has positioned itself as a “responsible” AI development leader.

“A robust, third-party evaluation ecosystem is essential for assessing AI capabilities and risks,” Anthropic emphasized. The company added that “developing high-quality, safety-relevant evaluations remains challenging, and the demand is outpacing the supply.”

What Makes a Good Evaluation?

Anthropic outlined several principles for good evaluations, including that they should be “sufficiently difficult” and “not in the training data.” The company stressed the importance of domain expertise: “If the evaluation is about expert performance on a particular subject matter (e.g., science), make sure to use subject matter experts to develop or review the evaluation.”

The company is accepting proposals through an online application form on a rolling basis. Its internal experts will work closely with selected teams to refine evaluation methods, noting that “refining an evaluation typically requires several iterations.”

Anthropic’s initiative could have far-reaching implications for the commercial AI landscape. By creating more reliable and comprehensive evaluation methods, businesses may gain the confidence to deploy AI solutions in critical areas such as healthcare, finance and customer service. This could potentially unlock productivity gains and new revenue streams across industries.

However, the success of this program will largely depend on the quality and relevance of the evaluations developed. If the new benchmarks fail to capture real-world scenarios adequately or are too narrowly focused, they may provide a false sense of security.

The challenge lies in creating rigorous evaluations to ensure safety and flexibility to keep pace with rapidly evolving AI capabilities. As the initiative unfolds, monitoring how well the resulting evaluations translate to practical commercial applications will be crucial.

For all PYMNTS AI coverage, subscribe to the daily AI Newsletter.

The post AI Evaluation Initiative Could Boost Commercial Adoption appeared first on PYMNTS.com.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Футбольный панна-турнир состоится в Благовещенске

В этом ж/д туре можно познакомиться с кухней народов и их кулинарными традициями

5 самых распространённых нарушений ПДД в Москве и какое наказание за них грозит в 2024 году

Подразделение «Русские ястребы» и спецназ ДНР обеспечат экипировкой из Нижнего Новгорода

Музыкальные новости

Военное следственное управление Следственного комитета Российской Федерации по Черноморскому флоту предупреждает:

LEON Вторая лига Б. «Спартак-2» крупно обыграл «Зенит-2», «Чертаново» победило «Знамя Труда»

«Терапия добра»: МТС Live с партнёрами откроет в Москве «Театр на Цветном»

Сеть клиник «Будь Здоров» приняла участие в VK Fest в Санкт-Петербурге

Новости России

Эксперт назвал условие для появления медуз в столичных водоемах

Театр «Грань» подвел итоги сезона

В правительстве обсудят сокращение вдвое размера кредита по IT-ипотек

В Москве прошла вечеринка под открытым небом в пространстве "VK Музыка"

Экология в России и мире

Профилактика утоплений

Textile Collection Moscow Autumn 2024: присоединяйтесь к масштабному событию текстиля – единому текстильному кластеру!

Такого вы еще не видели: в России проходит кастинг на участие в самом удивительном конкурсе красоты

Готовь лыжи летом

Спорт в России и мире

Более 100 спортсменов в Саратове принимают участие в Кубке России по настольному теннису памяти Паралимпийской чемпионки Наталии Мартяшевой

Уимблдон. 5 июля. Алькарас сыграет первым запуском на Центральном корте, Синнер – последним

Рублёв впервые с 2021 года проиграл в первом круге турнира Большого шлема

Энди Маррей заявил о желании стать тренером

Moscow.media

Столичные росгвардейцы оказали помощь ребенку, получившему травму

Вернувшийся из районов СВО сводный отряд спецназа Росгвардии встретили в Москве

Программа «Цифровой инвестор» ГМК "Норникель" выходит на новый этап

«Байкал Сервис»: «Канцтовары запасай, на перевозку скидку получай!»











Топ новостей на этот час

Rss.plus






«Золото» в пулевой стрельбе забрал юный талант из СФО

В правительстве обсудят сокращение вдвое размера кредита по IT-ипотек

«От сердца к сердцу»: стихотворение Анастасии Дудниковой

Ефимов: в Москворечье-Сабурове построят дома по реновации в рамках КРТ