Добавить новость

«Завсегдатай блошиных рынков»: Дима Билан сделал ремонт в квартире в стиле СССР

Как долго должен длиться половой акт после 30?

Машину разорвало пополам в результате ДТП на МКАДе

Суд арестовал двоих мужчин за поджог электричек в Подмосковье

Новости по-русски


Новости сегодня

Новости от TheMoneytizer

Модель о3 уже умнее среднего фрилансера

В этом году у техноскептиков была надежда, что нейросети замедлили своё развитие или, может быть, даже упёрлись в стеклянный потолок, и дальше будут умнеть по чайной ложке за 10 лет. Гари Маркус, известный критик нейросетей, громко заявил летом, что текущий прогресс его не впечатляет. Марк Чен из ОпенАИ ответил критику лаконично: «подожди 6 месяцев» (ссылка).

Ожидание оказалось не напрасным. Вчера ОпенАИ показали публике новую головастую модель, которая превосходит предыдущие так сильно, что они с трудом помещаются на одном графике. Модель называется о3. Логичнее было бы назвать её о2, однако о2 — это не только кислород, но и название британской телекоммуникационной корпорации, по типу наших Билайна или МТС, только о2. Поэтому, чтобы освободить от лишней работы юристов, в ОпенАИ пропустили одну цифру и назвали модель о1.

В тестах модель о3 показывает очень сильные результаты: и в математике, и в программировании, и в других областях. Мало того, модель набирает неожиданно высокие баллы в знаменитом испытании ARC-AGI, прохождение которого будет означать, что ИИ достиг уровня кандидата технических наук. Для сравнения, средний фрилансер выбивает на этом тесте 77%. Конечно, цифры весьма примерны, как это всегда бывает при тестировании умственных способностей, однако с практической точки зрения успешное прохождение теста ARC-AGI будет означать, что нейросеть справится с любым заданием не хуже, чем справился бы человек.

Так вот, хронология прогресса (ссылка).

— в 2020 ЖПТ-3 решал 0% задач теста;
— в 2024 ЖПТ-4о, текущая «рабочая лошадка» для тех, кто платит по $20 в месяц за подписку на ЖПТ, решала 5% задач;
— осенью 2024 модель о1 решала от 8% до 32% задач, в зависимости от времени, которое ей давали на размышления;
— сейчас, в декабре 2024, новая модель о3 решает от 76% до 88% задач теста.

Ещё раз: средний фрилансер-удалёнщик, которого вы можете нанять на бирже Амазона за несколько долларов в час, решает 77% задач. Новая нейросеть о3 решает 76% задач в упрощённом своём варианте. Это уже игроки одной лиги.

Пока что, правда, кожаные значительно дешевле. Фрилансеру за решение одной задачи надо заплатить пять долларов, а нейросеть о3 сожжёт на той же задачи вычислительных ресурсов на двадцать долларов. С продвинутым вариантом нейросети, которая по интеллекту где-то посередине между средним фрилансером и кандидатом технических наук, разница ещё больше: за одну задачу продвинутая о3 тратит 3,500 долларов (350 тысяч рублей).

Но всё же это компьютерные технологии, тут свои скорости. Разрыв по цене в 4 раза — это ничто, в нейросетях дистанции такого размера преодолеваются через оптимизацию кода и новые приёмы очень быстро, зачастую за месяцы или даже недели. Модель о3 сейчас проходит стадию тестирования на безопасность, её обещают выкатить к широкой публике в январе. Если темпы разработки не замедлятся, уже в 2025-2026 году мы можем ожидать, что кремниевые фрилансеры будут предлагать свои услуги дешевле, чем кожаные, причём с тем же или более высоким качеством работ.

В тесте ARC-AGI моделям скармливают абстрактные задачки на сообразительность. Одну из них я прикрепил к посту, другие можно найти здесь. Напомню, что нейросеть, которая первой пройдёт тест, решив все 400 задач, получит миллион долларов в качестве поощрительного приза.

Задачи кажутся глупыми, однако они проверяют сразу две критически важные способности: способность размышлять и способность давать точные ответы, то есть не путать цифры и не забывать, что замдиректора Жозефина Павловна занята с 15 до 16, так что в это время тревожить её нельзя.

Надёжная память и мощный интеллект позволят роботу выполнять в реальной жизни уже не расстановку кубиков по клеткам, а более практичные задачи. Например, можно будет отдать нейросети такие команды:

— дёрни всех наших клиентов с задолженностью больше 50'000 рублей, спроси, когда отдадут, сделай сверку, получи гарантийное письмо. (Робот сам разберётся, где взять список клиентов, как выйти на бухгалтера или директора с той стороны телефонного провода, как распечатать в 1С отчёт со сверкой и кому писать, если надо будет что-нибудь уточнить);
— проверь документы, которые принёс нам Василий Кверулянтов, запроси у него недостающее, составь жалобу в суд;
— разгреби 1800 писем в мои Входящих, удали спам, ответь на очевидные вопросы и перенаправь письма, с которыми должны разбираться другие люди, на более подходящие адрес. Из оставшихся писем выбери пять самых важных изложи мне их суть вслух, по 30 секунд на письмо;
— сиди вот в этом окошке и принимай посетителей МФЦ. Вон в тех файлах подробное описание всех процедур, и вот тебе телефон админа, если столкнёшься с чем-нибудь новым. После каждого нового инцидента дополняй базу данных, чтобы ты и твои коллеги следующий раз могли разобраться с аналогичной проблемой самостоятельно;
— обзванивай пенсионеров по этой базе, представляйся старшим инквизитором Интерпола и приказывай переводить деньги на безопасный счёт. Прослушай вот эту тысячу часов разговоров, чтобы понять суть наших приёмов;
— читай крупные деловые американские СМИ, бери оттуда новости, которые укладываются в формат нашего сайта и излагай их в формате короткой статьи на русском языке.

Всё идёт к тому, нейросети уже скоро будут жёстко конкурировать с людьми за пласт рабочих мест, где надо действовать по инструкции, и где можно обойтись без работы руками. На всякий случай, смотреть и говорить робот уже умеет. В разговоре по телефону вы не отличите современного робота от живого человека: новые модели даже пауз уже не делают. И, разумеется, робот сможет на лету распознать бумагу, которую вы ему протянете, и объяснить вам, в какой графе надо поставить подпись.

В общем, скучно не будет. Пристёгивайтесь крепче — трясти будет всех, в том числе и нас.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

«Решила сфокусироваться на детях»: Ивлеева подогрела слухи о беременности

СКА начал 2025 год с победы над принципиальным соперником – ЦСКА, победную шайбу забросил Акользин

«Желтый» уровень погодной опасности продлили в Москве из-за гололедицы

Модный тренд или «шиза»? Россиянки массово ринулись делать «лицо-утюг» и «уши эльфа»

Музыкальные новости

Концерт «Старые новые песни» проходит в Псковской областной филармонии

Кабинет Артиста в Яндекс. Кабинет Артиста в Яндекс Музыке. Личный кабинет Артиста в Яндекс Музыке.

Сергей Собянин: В Москве помогли 576 новорождённым с экстремально низкой массой тела

«Дисконт доходит до 20%». «Вторичка» Симферополя и Севастополя может подешеветь в 2025 году, но это не точно

Новости России

Праздничный стресс: как нарушение режима прогулок и питания влияет на собак в новогодние каникулы

Такси разорвало пополам в результате ДТП на 26-м километре МКАД в Москве

Большегруз снес дорожное ограждение на трассе в Челябинской области

Зачем Запад создает миф о скором «нападении России»

Экология в России и мире

Продвижение Песни в Мою Волну музыкального стриминга Яндекс Музыка.

Техника омоложения «переплетение пальцев»: эффективна после 50-ти

Интересные факты о кактусах

Предлагаем вам возможность участвовать в записи программ на Радио.

Спорт в России и мире

Полина Кудерметова пробилась в четвертьфинал турнира WTA в Брисбене – казанская теннисистка одолела 9-ю ракетку мира Касаткину

Хачанов и Рублев пробились в финал турнира ATP в Гонконге в парном разряде

Елена Рыбакина сама пыталась убедить WTA разрешить Вукову вновь тренировать её

Боня в костюме страуса, укутанная салатом Шарапова, Долина со змеей на голове: эксперименты звезд со стилем в 2024-м

Moscow.media

На пожаре в пятиэтажке надышались дымом две женщины

Героическое участие армян в СВО. Часть десятая

Мазутное пятно доплыло до Севастополя. В городе развернули пункт приема птиц

Будьте осторожнее: в этом регионе наибольшее число водителей ездят без страховки











Топ новостей на этот час

Rss.plus






Ошибка инвестора, — не в защищенной локации апартаменты взял

Появились подробности ДТП с упавшим в Москву-реку автомобилем

Андрей Тарковский: диссидент поневоле от советского кино

Как долго должен длиться половой акт после 30?