Добавить новость

Авиакомпания Turkmenistan организует два рейса для вывоза пассажиров из Москвы

В Москве в рамках капремонта обновили инженерные системы в более 11,2 тыс домах

В Новой Москве салют попал в окна квартиры и выбил все стёкла

«Германия беззащитна перед атакой «Орешника». «Небо Франции полностью открыто». Эксперты делают неутешительный вывод о российской ракете

Новости по-русски


Новости сегодня

Новости от TheMoneytizer

OpenAI представила модели o3: думают как о1, но делают всё гораздо лучше

Сегодня, 20 декабря, компания OpenAI официально представила миру семейство моделей o3 (на данный момент речь идёт про o3 и o3-mini), которые выступают преемниками «разумной» о1 и ещё на шаг приближают разработчика к созданию общего искусственного интеллекта. Например, в рамках теста ARC-AGI, который был специально создан для сравнения возможностей искусственного интеллекта с интеллектом человека, модель o3 более чем в три раза превзошла возможности o1, продемонстрировав результат в 88%.

А в рамках теста EpochAI's Frontier Math новая модель поставила новый рекорд, решив 25,2% задач. Стоит отметить, что ни одна другая модель ранее не могла превзойти отметку даже в 2%.

Кроме того, при прохождении теста AIME 2024 модель o3 набрала 96,7%, пропустив всего один вопрос, а в процессе испытания GPQA Diamond модель набрала 87,7% — значительно больше, чем любой результат человека-эксперта. Есть внушительные достижения и в вопросах написания кода — при прохождении бенчмарка SWE-bench Verified свежая модель набрала 71,7% точности ответов, тогда как версия o1 preview демонстрирует всего 41,3% точности. В Codeforces o3 набирает 2727 баллов — почти в 2,5 раза больше собрата. И это при учёте того, что модель o1 на самом деле тоже весьма производительная и «умная».

Весомым преимуществом o3, как и o1, является возможность модели «рассуждать» и эффективно проверять свои же факты, чтобы избегать различного рода ошибок и галлюцинаций. Правда, разработчики из OpenAI заявили, что процесс проверки фактов перед выдачей ответа приводит к небольшой задержке — от нескольких секунд до нескольких минут (зависит от сложности вопроса). Но преимущество в том, что эта задержка, связанная с тем, что искусственный интеллект «думает» перед тем, как ответить пользователю, позволяет модели более точно отвечать на вопросы по физике, математике и прочих точных науках.

Хорошая новость в том, что пользователь может регулировать время рассуждений модели — можно настроить низкий, средний или высокий уровень времени на обдумывание ответа (чем выше этот уровень, тем лучше работает o3). При этом журналисты из издания TechCrunch отмечают, что основной недостаток «рассуждающих» моделей в том, что для их работы требуется гораздо больше вычислительных мощностей, так что в итоге они дороже «обычных» решений. И хотя пока что такие ИИ показывают внушительный прирост результатов в бенчмарках, не совсем ясно, смогут ли модели поддерживать такие темпы в обозримом будущем.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Авиакомпания Turkmenistan организует два рейса для вывоза пассажиров из Москвы

Flightradar: Российский спецборт Ил-96 совершил перелет в США и обратно

Продвижение Музыки. Раскрутка Музыки. Продвижение Песни. Раскрутка Песни.

В Москве в рамках капремонта обновили инженерные системы в более 11,2 тыс домах

Музыкальные новости

Экс-главный стратег Трампа назвал Маска малышом и призвал проверить его здоровье

МТС подключила люки на Сахалине к системам «умного» города, чтобы их не воровали

Что работодатели должны знать о поколении Z?

Как не ошибиться в выборе оптового поставщика автозапчастей?

Новости России

Глюк'оZа выступала в неадеквате, Долина лишилась миллионов, у Дурова более 100 детей и ненасытная бывшая: скандалы года

Шоумен Отар Кушанашвили назвал Пугачеву человеком с большим сердцем

Авиакомпания Turkmenistan организует два рейса для вывоза пассажиров из Москвы

Захарова объяснила полет спецборта из РФ в США ротацией дипломатов

Экология в России и мире

Детское радио расколдовало главного Деда Мороза – Новому году быть!

Чувашский художник из Петербурга

«Двух, а лучше трёх»: Григорий Лепс мечтает о совместных детях с 18-летней возлюбленной

Что работодатели должны знать о поколении Z?

Спорт в России и мире

Эрика Андреева проиграла Волынец в первом круге турнира WTA в Окленде

Полина Кудерметова вышла во второй круг турнира WTA в Брисбене

Джокович рассказал о планах на 2025 год

Открытие Игр в Париже, допинг Синнера и Свёнтек и заявление Федорищева: главные скандалы 2024 года в спорте

Moscow.media

Хулиганская выходка жителя Орловской области обернулась реальным сроком

Терминал сбора данных (ТСД) промышленного класса SAOTRON RT42G

Певец Шарлота* получил срок и отправится в колонию

Яркий финал года- турнир ФОНКОД 2024 стал самым знаковым событием в спортивном программировании











Топ новостей на этот час

Rss.plus






Захарова объяснила полет спецборта из РФ в США ротацией дипломатов

Шоумен Отар Кушанашвили назвал Пугачеву человеком с большим сердцем

«Ъ»: Игорь Маковский возглавил Военно-строительную компанию Минобороны России

«Германия беззащитна перед атакой «Орешника». «Небо Франции полностью открыто». Эксперты делают неутешительный вывод о российской ракете