В недавнем опросе, проведённом среди пользователей ChatGPT, выяснилось, что почти треть опрошенных откажется от использования ИИ-бота или станет пользоваться им реже, если технология для определения авторства будет внедрена. Она работает за счёт маркировки текста невидимыми водяными знаками, которые можно обнаружить с помощью специального инструмента от OpenAI. В результате можно установить, что весь текст или его часть были написаны ChatGPT.
Такую проверку всё ещё можно обмануть: водяные знаки можно легко удалить с помощью простых методов, таких как перевод текста через Google Translate на другой язык и обратно. Добавление и последующее удаление эмодзи тоже сработает.
Как сообщает https://www.wsj.com/tech/ai/openai-tool-chatgpt-cheating-wri... , в начале июня руководство и исследователи OpenAI провели встречу для обсуждения проекта. Участники согласились с высокой эффективностью технологии водяных знаков для определения авторства текста, но результаты опроса пользователей ChatGPT вызвали опасения по поводу возможной потери аудитории, и окончательное решение так и не было принято. К дискуссии присоединились генеральный директор OpenAI Сэм Альтман и технический директор Мира Мурати.
В заявлении для https://techcrunch.com/2024/08/04/openai-says-its-taking-a-d... представитель OpenAI подтвердил, что компания исследует возможность внедрения водяных знаков в текст, но подчеркнул, что идею реализуют с осторожностью из-за "сложностей и возможного воздействия на более широкую экосистему за пределами OpenAI."
"Метод водяных знаков для текста, который мы разрабатываем, технически многообещающий, но имеет важные риски, которые мы оцениваем, исследуя альтернативы, включая уязвимость для обхода недобросовестными пользователями и потенциальное непропорциональное воздействие на неанглоязычных клиентов." — сказал представитель.
Стоит отметить, что Google также разработала технологию водяных знаков под названием SynthID, предназначенную для обнаружения текста, созданного с помощью Gemini AI. Она находится на стадии бета-тестирования и тоже недоступна для широкой публики