Добавить новость

В Москве мужчина пытался сжечь полицейскую машину и был пойман

Политолог: БРИКС для Таиланда – альтернатива сотрудничеству с США

США сорвали добровольный взнос РФ в бюджет Красного Креста

Завершены монолитные работы на первой очереди жилого квартала в Бутырском районе





Новости сегодня

Новости от TheMoneytizer

Модель о3 уже умнее среднего фрилансера

В этом году у техноскептиков была надежда, что нейросети замедлили своё развитие или, может быть, даже упёрлись в стеклянный потолок, и дальше будут умнеть по чайной ложке за 10 лет. Гари Маркус, известный критик нейросетей, громко заявил летом, что текущий прогресс его не впечатляет. Марк Чен из ОпенАИ ответил критику лаконично: «подожди 6 месяцев» (ссылка).

Ожидание оказалось не напрасным. Вчера ОпенАИ показали публике новую головастую модель, которая превосходит предыдущие так сильно, что они с трудом помещаются на одном графике. Модель называется о3. Логичнее было бы назвать её о2, однако о2 — это не только кислород, но и название британской телекоммуникационной корпорации, по типу наших Билайна или МТС, только о2. Поэтому, чтобы освободить от лишней работы юристов, в ОпенАИ пропустили одну цифру и назвали модель о1.

В тестах модель о3 показывает очень сильные результаты: и в математике, и в программировании, и в других областях. Мало того, модель набирает неожиданно высокие баллы в знаменитом испытании ARC-AGI, прохождение которого будет означать, что ИИ достиг уровня кандидата технических наук. Для сравнения, средний фрилансер выбивает на этом тесте 77%. Конечно, цифры весьма примерны, как это всегда бывает при тестировании умственных способностей, однако с практической точки зрения успешное прохождение теста ARC-AGI будет означать, что нейросеть справится с любым заданием не хуже, чем справился бы человек.

Так вот, хронология прогресса (ссылка).

— в 2020 ЖПТ-3 решал 0% задач теста;
— в 2024 ЖПТ-4о, текущая «рабочая лошадка» для тех, кто платит по $20 в месяц за подписку на ЖПТ, решала 5% задач;
— осенью 2024 модель о1 решала от 8% до 32% задач, в зависимости от времени, которое ей давали на размышления;
— сейчас, в декабре 2024, новая модель о3 решает от 76% до 88% задач теста.

Ещё раз: средний фрилансер-удалёнщик, которого вы можете нанять на бирже Амазона за несколько долларов в час, решает 77% задач. Новая нейросеть о3 решает 76% задач в упрощённом своём варианте. Это уже игроки одной лиги.

Пока что, правда, кожаные значительно дешевле. Фрилансеру за решение одной задачи надо заплатить пять долларов, а нейросеть о3 сожжёт на той же задачи вычислительных ресурсов на двадцать долларов. С продвинутым вариантом нейросети, которая по интеллекту где-то посередине между средним фрилансером и кандидатом технических наук, разница ещё больше: за одну задачу продвинутая о3 тратит 3,500 долларов (350 тысяч рублей).

Но всё же это компьютерные технологии, тут свои скорости. Разрыв по цене в 4 раза — это ничто, в нейросетях дистанции такого размера преодолеваются через оптимизацию кода и новые приёмы очень быстро, зачастую за месяцы или даже недели. Модель о3 сейчас проходит стадию тестирования на безопасность, её обещают выкатить к широкой публике в январе. Если темпы разработки не замедлятся, уже в 2025-2026 году мы можем ожидать, что кремниевые фрилансеры будут предлагать свои услуги дешевле, чем кожаные, причём с тем же или более высоким качеством работ.

В тесте ARC-AGI моделям скармливают абстрактные задачки на сообразительность. Одну из них я прикрепил к посту, другие можно найти здесь. Напомню, что нейросеть, которая первой пройдёт тест, решив все 400 задач, получит миллион долларов в качестве поощрительного приза.

Задачи кажутся глупыми, однако они проверяют сразу две критически важные способности: способность размышлять и способность давать точные ответы, то есть не путать цифры и не забывать, что замдиректора Жозефина Павловна занята с 15 до 16, так что в это время тревожить её нельзя.

Надёжная память и мощный интеллект позволят роботу выполнять в реальной жизни уже не расстановку кубиков по клеткам, а более практичные задачи. Например, можно будет отдать нейросети такие команды:

— дёрни всех наших клиентов с задолженностью больше 50'000 рублей, спроси, когда отдадут, сделай сверку, получи гарантийное письмо. (Робот сам разберётся, где взять список клиентов, как выйти на бухгалтера или директора с той стороны телефонного провода, как распечатать в 1С отчёт со сверкой и кому писать, если надо будет что-нибудь уточнить);
— проверь документы, которые принёс нам Василий Кверулянтов, запроси у него недостающее, составь жалобу в суд;
— разгреби 1800 писем в мои Входящих, удали спам, ответь на очевидные вопросы и перенаправь письма, с которыми должны разбираться другие люди, на более подходящие адрес. Из оставшихся писем выбери пять самых важных изложи мне их суть вслух, по 30 секунд на письмо;
— сиди вот в этом окошке и принимай посетителей МФЦ. Вон в тех файлах подробное описание всех процедур, и вот тебе телефон админа, если столкнёшься с чем-нибудь новым. После каждого нового инцидента дополняй базу данных, чтобы ты и твои коллеги следующий раз могли разобраться с аналогичной проблемой самостоятельно;
— обзванивай пенсионеров по этой базе, представляйся старшим инквизитором Интерпола и приказывай переводить деньги на безопасный счёт. Прослушай вот эту тысячу часов разговоров, чтобы понять суть наших приёмов;
— читай крупные деловые американские СМИ, бери оттуда новости, которые укладываются в формат нашего сайта и излагай их в формате короткой статьи на русском языке.

Всё идёт к тому, нейросети уже скоро будут жёстко конкурировать с людьми за пласт рабочих мест, где надо действовать по инструкции, и где можно обойтись без работы руками. На всякий случай, смотреть и говорить робот уже умеет. В разговоре по телефону вы не отличите современного робота от живого человека: новые модели даже пауз уже не делают. И, разумеется, робот сможет на лету распознать бумагу, которую вы ему протянете, и объяснить вам, в какой графе надо поставить подпись.

В общем, скучно не будет. Пристёгивайтесь крепче — трясти будет всех, в том числе и нас.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Арсеньев оставили без моста и крытого катка

Более 3,5 тыс жителей Балашихи уже посетили врачей в новой поликлинике в Саввино

Азербайджан подтвердил сбитие самолета Россией: парламент требует извинений от Москвы

В новогоднюю ночь в Москве может произойти землетрясение — сейсмолог

Музыкальные новости

«Единая Россия» исполнила детские мечты на «Елке желаний»

Певица Ольга Бурлуцкая выступила в ИК-5 и Можайской ВК ГУФСИН России по Московской области

Илья Авербух готовит новое ледовое шоу «Мама» к Новому году

Анна Седокова из больницы обратилась к погибшему бывшему мужу Янису Тимме

Новости России

Участники нападения на свадебный кортеж в Щелково получили по 4 года

Водитель заглохшего Lexus погиб в страшной аварии в Лефортовском тоннеле

Вернуть все как было: как принять новую себя и восстановиться после родов

Остап Стужев с детективом «Золотые пилигримы» был удостоен награды на премии Dress Code Award 2024 за вклад в развитие культуры и искусства в стране

Экология в России и мире

Сотрудники Marins Park Hotel Ростов провели интерактивную экскурсию для подопечных АНО «Белый Ангел»

Эксперты «Будь Здоров» оценили проекты участников акселерационной программы Государственного университета управления «Технологии здоровой жизни 2.0»

В отеле «Ялта-Интурист» прошёл второй бал «Молодость»

Надолго и всерьез: «детский» формат ГПМ Радио запущен в 30 городах

Спорт в России и мире

По стопам Синнера и Алькараса: молодёжный Итоговый турнир ATP выиграл 18-летний бразилец

Энди Роддик назвал имя теннисистки, которая может удивить всех в 2025 году

Путинцева о том, как с травмой колена победила Швентек на «Уимблдоне»: «Думала: блин, пусть после этого матча вообще больше ничего не сыграю, но ее я сегодня обыграю»

Петкович: когда Алькарас плох, он чертовски ужасен. У него нет плана Б

Moscow.media

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

На месте дач УрО РАН на Шарташе создадут туристическую зону

Филиал № 4 ОСФР по Москве и Московской области информирует: Свыше 110 уроков пенсионной грамотности провели сотрудники Отделения СФР по Москве и Московской области

Портативный ТСД корпоративного класса Saotron RT-T70











Топ новостей на этот час

Rss.plus






Участники нападения на свадебный кортеж в Щелково получили по 4 года

Студентка ИРНИТУ Екатерина Кутявина выиграла конкурс «Твой Ход-2024» с проектом в номинации «Делаю»

На западе Москвы загорелся паркинг

Остап Стужев с детективом «Золотые пилигримы» был удостоен награды на премии Dress Code Award 2024 за вклад в развитие культуры и искусства в стране