Институт инженеров электротехники и электроники (IEEE) провел тест Тьюринга, чтобы оценить, насколько современные модели искусственного интеллекта могут имитировать человеческое общение. Как сообщает портал LiveScience, в эксперименте участвовали 500 человек, которым предлагалось общаться с четырьмя собеседниками: одним человеком и тремя ИИ-моделями - ELIZA 1960-х годов, GPT-3.5 и GPT-4.
Результаты теста показали, что 54% участников приняли GPT-4 за человека, что стало самым высоким показателем среди всех искусственных собеседников. Для сравнения: GPT-3.5 удалось обмануть 50% испытуемых, а более старая модель ELIZA - лишь 22%. Человек был распознан как человек 67% участников.
Элеонора Уотсон, исследователь искусственного интеллекта из IEEE, отметила, что современные ИИ-системы все чаще демонстрируют поведение, свойственное людям, включая способности к манипуляции и даже умышленному обману. Это подчеркивает необходимость более глубокой оценки и понимания ИИ-технологий, отметила она.
Тест Тьюринга, предложенный Аланом Тьюрингом в 1950 году, остается ключевым инструментом для определения способности машины проявлять интеллектуальное поведение, неотличимое от человеческого. По условиям теста, если испытуемый не может отличить машину от человека, то машина считается прошедшей тест и способной к мышлению.