Добавить новость

Кыргызстанца в Москве задержали и пытали полицейские

«Нужно разрешить приобретать жильё на вторичном рынке»: Путин предложил расширить условия семейной ипотеки

Агент Сафонов верит, что клубы РПЛ будут играть в еврокубках в следующем сезоне

УЕФА хочет вернуть клубы из сборные России – Колосков



Новости сегодня

Новости от TheMoneytizer

OpenAI представила модели o3: думают как о1, но делают всё гораздо лучше

Сегодня, 20 декабря, компания OpenAI официально представила миру семейство моделей o3 (на данный момент речь идёт про o3 и o3-mini), которые выступают преемниками «разумной» о1 и ещё на шаг приближают разработчика к созданию общего искусственного интеллекта. Например, в рамках теста ARC-AGI, который был специально создан для сравнения возможностей искусственного интеллекта с интеллектом человека, модель o3 более чем в три раза превзошла возможности o1, продемонстрировав результат в 88%.

А в рамках теста EpochAI's Frontier Math новая модель поставила новый рекорд, решив 25,2% задач. Стоит отметить, что ни одна другая модель ранее не могла превзойти отметку даже в 2%.

Кроме того, при прохождении теста AIME 2024 модель o3 набрала 96,7%, пропустив всего один вопрос, а в процессе испытания GPQA Diamond модель набрала 87,7% — значительно больше, чем любой результат человека-эксперта. Есть внушительные достижения и в вопросах написания кода — при прохождении бенчмарка SWE-bench Verified свежая модель набрала 71,7% точности ответов, тогда как версия o1 preview демонстрирует всего 41,3% точности. В Codeforces o3 набирает 2727 баллов — почти в 2,5 раза больше собрата. И это при учёте того, что модель o1 на самом деле тоже весьма производительная и «умная».

Весомым преимуществом o3, как и o1, является возможность модели «рассуждать» и эффективно проверять свои же факты, чтобы избегать различного рода ошибок и галлюцинаций. Правда, разработчики из OpenAI заявили, что процесс проверки фактов перед выдачей ответа приводит к небольшой задержке — от нескольких секунд до нескольких минут (зависит от сложности вопроса). Но преимущество в том, что эта задержка, связанная с тем, что искусственный интеллект «думает» перед тем, как ответить пользователю, позволяет модели более точно отвечать на вопросы по физике, математике и прочих точных науках.

Хорошая новость в том, что пользователь может регулировать время рассуждений модели — можно настроить низкий, средний или высокий уровень времени на обдумывание ответа (чем выше этот уровень, тем лучше работает o3). При этом журналисты из издания TechCrunch отмечают, что основной недостаток «рассуждающих» моделей в том, что для их работы требуется гораздо больше вычислительных мощностей, так что в итоге они дороже «обычных» решений. И хотя пока что такие ИИ показывают внушительный прирост результатов в бенчмарках, не совсем ясно, смогут ли модели поддерживать такие темпы в обозримом будущем.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Во Франции причастные к убийству учителя в 2020 году получили до 16 лет

Жители многоквартирного дома в Химках жалуются на крыс и обледеневшие окна

Кыргызстанца в Москве задержали и пытали полицейские

Врачи частных клиник в Москве обошли в зарплате пеших курьеров

Музыкальные новости

Суд отказал Наталье Лапиной в исковых требованиях к адвокату Успенской

Супруга Башара Асада проходит лечение от рака в Москве, семья рядом

Стало известно, когда Овечкин сыграет за «Вашингтон» в НХЛ после перелома

Футболиста «Спартака» хотят видеть за рубежом, Неймар воссоединится с Месси и Суаресом. Трансферы и слухи дня

Новости России

Эксперты назвали привычки, которые помогут сохранить ясный ум в старости

В Гусь-Хрустальном прошли «Варваринские дни»

Жители многоквартирного дома в Химках жалуются на крыс и обледеневшие окна

«Крокус» уроком не стал, теперь генерал Кириллов: будет визовый режим или продолжим жить «в безопасности» по Федорову

Экология в России и мире

Трагедия карабахцев: Ашот Бегларян. Колонна длиною в жизнь

Щелкунчик с Фарухом Рузиматовым на сцене Александринского театра Санкт- Петербурга  

Сколько стоит Настя Ивлеева: Super выяснил, за какую сумму блогер готова провести корпоратив и вернется ли она на экраны

Новогодние каникулы в Астрахани

Спорт в России и мире

Вероника Кудерметова поднялась на одну строчку в рейтинге WTA

Елена Рыбакина уверенно обыграла Симону Халеп в матче Мировой теннисной лиги

Арина Соболенко выложила эффектные фото в коротком платье

Андрей Рублёв и Денис Шаповалов проиграли Томпсону и Нагалу в матче Мировой теннисной лиги

Moscow.media

Портативный ТСД корпоративного класса Saotron RT-T70

Рилсмейкер. Услуги Рилсмейкера.

Прикоснуться к истокам: у россиян выросла потребность во внутреннем туризме











Топ новостей на этот час

Rss.plus






В Гусь-Хрустальном прошли «Варваринские дни»

Серохвостов выиграл гонку преследования на третьем этапе Кубка Содружества в Чайковском

УЕФА хочет вернуть клубы из сборные России – Колосков

Скорость на радость: симулятор автогонок научит безаварийному вождению