Искусственный интеллект приближается к уровню, способному изменить привычные представления о технологиях и их роли в обществе.
Новая модель искусственного интеллекта от OpenAI, o3, продемонстрировала буквально «человеческий» уровень интеллекта, показав 85% точности в тесте ARC-AGI. Этот результат значительно превосходит предыдущий рекорд среди ИИ в 55% и находится на уровне средней оценки человека. Успех o3 вызвал горячие споры в научном сообществе и подогрел дискуссии о приближении к созданию общего искусственного интеллекта (AGI).
ARC-AGI — это тест, разработанный для оценки способности ИИ адаптироваться к новым задачам с ограниченным количеством примеров. Он проверяет так называемую «эффективность выборки», то есть насколько быстро система может обучиться, увидев всего несколько образцов. В отличие от таких моделей, как ChatGPT (GPT-4), которые требуют миллионы примеров для построения вероятностных «правил», o3 демонстрирует впечатляющую способность к генерализации — ключевую черту интеллекта.
Тесты ARC-AGI включают задачи с сетками, где ИИ необходимо выявить закономерность, чтобы преобразовать одну сетку в другую. Например, система получает три примера для изучения правил преобразования, а затем применяет их к новому случаю. Эти задачи напоминают тесты на IQ, знакомые многим людям.