Добавить новость

В Минздраве РФ рассказали о состоянии выживших в авиакатастрофе в Актау россиян

Убийца полицейского и его жены в Краснодарском крае совершил суицид

Пашинян и Лукашенко поспорили на саммите ЕАЭС из-за формата участия Армении

Эксперт назвал реновацию одним из ключевых инструментов градостроительной политики Москвы



Новости по-русски


Новости сегодня

Новости от TheMoneytizer

На шаг ближе к AGI: OpenAI анонсировала новые модели о3

Причиной выбора названия «o3» для семейства моделей вместо «o2» стало стремление избежать юридических споров с британским оператором связи O2 из-за сходства товарных знаков. В новых моделях используется разработанный OpenAI метод, получивший название «приватная цепочка рассуждений». Суть его заключается в том, что перед формированием ответа модель делает своего рода паузу для анализа своего «внутреннего диалога» и планирования дальнейших действий. Этот процесс можно охарактеризовать как «имитацию рассуждений» (SR) — подход, представляющий собой более продвинутую форму искусственного интеллекта по сравнению с базовыми большими языковыми моделями (БЯМ).

На практике, получив запрос, o3 перед выдачей ответа делает паузу, в течение которой анализирует ряд связанных запросов и попутно «разъясняет» ход своих рассуждений. После этого модель формулирует итоговый ответ, который считает наиболее точным. Предыдущая версия, o1, была первой крупной моделью, способной к рассуждениям. По сути, она представляет собой большую языковую модель, обученную с использованием метода обучения с подкреплением (RL). В основе o3 лежит дальнейшее масштабирование обучения с подкреплением по сравнению с o1.

Главное отличие o3 от o1 — возможность настройки времени рассуждения (низкое, среднее, высокое). Чем больше времени модель «думает», тем лучше результат. Однако даже o3 не застрахована от ошибок и «галлюцинаций», как, например, o1 в крестиках-ноликах.

OpenAI с осторожностью предполагает, что o3 может приближаться к общему искусственному интеллекту (AGI) при соблюдении ряда условий. В тесте ARC-AGI, разработанном для оценки способности системы ИИ приобретать новые навыки вне данных, на которых она была обучена, o3 достигла результата 87,5% при использовании высоких вычислительных мощностей. Даже в худшем случае (при низких вычислительных мощностях) модель показала результат в три раза лучше, чем o1. Вместе с тем, o3 не справляется с «очень простыми задачами» в ARC-AGI, что указывает на «фундаментальные различия» между этой моделью и человеческим интеллектом.

В тесте SWE-Bench Verified, оценивающем навыки программирования, o3 превзошла o1 на 22,8 процентных пункта, достигая рейтинга Codeforces 2727 (2400 соответствуют 99,2 процентилю инженеров). На Американском пригласительном экзамене по математике 2024 года o3 набрала 96,7% (одна ошибка), а в GPQA Diamond (биология, физика, химия, университетский уровень) — 87,7%. В бенчмарке Frontier Math от EpochAI o3 установила новый рекорд — 25,2% решенных задач (у других моделей менее 2%).

Главный вопрос заключался в том, объявит ли OpenAI о приближении своих новых моделей к общему искусственному интеллекту. AGI обычно определяется как ИИ, способный выполнять любые человеческие задачи. OpenAI дает собственное определение: «высокоавтономные системы, превосходящие людей в большинстве экономически значимых видов деятельности». Заявление о достижении AGI стало бы важным событием, имеющим и договорные https://hightech.plus/2024/12/11/sem-altman-obshii-ii-poyavi... для OpenAI: по соглашению с Microsoft, после достижения AGI компания не обязана предоставлять Microsoft доступ к своим самым передовым технологиям, соответствующим этому определению. Выпуск новой модели OpenAI произошел на фоне разработки аналогичных инструментов другими компаниями, включая Google (Gemini 2.0 Flash Thinking Experimental), DeepSeek (DeepSeek-R1) и Alibaba (QwQ, первая «открытая» альтернативой o1).

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

В Москве арестовали главу отдела управления Росприроднадзора по делу о взятке

Юрист Хаминский: госпошлина за развод вырастет до 5000 рублей с 1 января

Самолет разбился в аэропорту Муан в Южной Корее из-за неисправности шасси

Россия и Иран подписывают "всепогодный" договор: новое стратегическое партнёрство

Музыкальные новости

В Подмосковье сотрудники Росгвардии задержали подозреваемого в краже дорогостоящих товаров из гипермаркета

Молоденькая красотка рассекретила появление Валерия Меладзе в Москве: опальный артист исхудал на чужбине

Более 350 детей работников Приморского филиала ФГУП "УВО Минтранса России" получили сладкие новогодние подарки

В Московской области при силовой поддержке ОМОН 'Пересвет" Росгвардии задержаны подозреваемые в разбойном нападении на пенсионерку

Новости России

ТАСС: завершено следствие по делу в отношении экс-глав департаментов "Станкина"

Россия и Иран подписывают "всепогодный" договор: новое стратегическое партнёрство

Количество погибших при крушении самолета в Южной Кореи увеличилось до 47

Экипажи ВКС РФ под прикрытием Су-35С разбили технику ВСУ в курском приграничье

Экология в России и мире

Рождественское путешествие

Что работодатели должны знать о поколении Z?

В Нижнем Новгороде прошли съёмки сериала «Камбэк» с Александром Петровым в главной роли

Дочь Успенской признали "Лучшей поэтессой года" и наградили. А за какие заслуги?

Спорт в России и мире

Даниил Медведев обошёл Пита Сампраса по сумме заработанных за карьеру призовых

Матс Виландер: «В 2025-м Синнер выиграет больше «Шлемов», чем Алькарас. Мой очень, очень, очень смелый прогноз – один из них оформит календарный Большой шлем»

Елена Рыбакина поделилась долгожданной хорошей новостью

Тарпищев: в 2025 году Мирра Андреева может войти в первую десятку WTA

Moscow.media

Певец Шарлота* получил срок и отправится в колонию

В Башкортостане начальник академии Росгвардии генерал-майор Андрей Кийко провел профориентационное занятие с учащимися кадетского корпуса

Терминал сбора данных (ТСД) промышленного класса SAOTRON RT42G

Пришла зима...











Топ новостей на этот час

Rss.plus






Россия сохранит ракетно-ядерную стабильность: заявление Лаврова о США

Юрист Хаминский: госпошлина за развод вырастет до 5000 рублей с 1 января

ТАСС: завершено следствие по делу в отношении экс-глав департаментов "Станкина"

Рёнхап: 28 человек погибли в авиакатастрофе в южнокорейском аэропорту Муан