Мебельный гвоздь в крышку гроба AGI
Все мы слышали, что нейросети уже решают сложнейшие олимпиадные задачи по математике, пишут код лучше людей и вообще «кожаным мешкам» осталось недолго. Но есть нюанс. Если задача похожа на то, что было в датасете, они её решат. Если же задача требует построения геометрической модели и физической интуиции, отличается от типичных моделей из задачников — начинается «галлюцинаторный цирк».
Сегодня я покажу вам одну физическую задачу про мебельный гвоздь. Она выглядит совершенно безобидно, но на ней ломаются ВСЕ современные LLM. Более того, если эту задачу загонять в одну и ту же нейросетку много раз, она каждый раз выдает новое бредовое "решение" с новым неправильным "ответом"!
А заодно мы поймем: как составлять задачи, чтобы человек их решал, а AI — нет.
Читать далее