OpenAI, материнская компания ChatGPT, представила первую официальную публичную предварительную версию DALL-E 3 – своей последней модели генерации изображений.
Большинство современных инструментов создания изображений на базе искусственного интеллекта сегодня принимают подсказки (описания изображений) и превращают их в произведения искусства в самых разных стилях – от фотореалистичного до фантастического. Как заявляет OpenAI, DALL-E 3 будет лучше понимать подсказки по сравнению с DALL-E 2, особенно в отношении более длинных указаний пользователей.
Новой функцией DALL-E 3 стала интеграция с ChatGPT. Используя ChatGPT, не нужно придумывать собственные подробные инструкции по работе с DALL-E 3, а вместо этого можно попросить ChatGPT придумать подсказку, и чат-бот её напишет.
Интеграция ChatGPT – не единственное нововведение в DALL-E 3. DALL-E 3 также генерирует изображения более высокого качества, которые более точно отражают подсказки. Помимо этого, в DALL-E 3 повысилась безопасность для предотвращения создания непристойных или потенциально ненавистнических изображений.
Компания специально работала с «красными командами» (группой, которая намеренно пытается взломать систему), чтобы проверить безопасность новой версии способ и научить языковые модели игнорировать определенные слова, чтобы избежать явных или жестоких подсказок.
Примечательно, что DALL-E 3 будет отклонять запросы, в которых пользователи просят ИИ создать произведение искусства, созданное по образцу стиля ныне живущих художников или общественных деятелей. В то же время художники также смогут отказаться от использования их собственных работ для обучения будущих итераций генеративного ИИ – по крайней мере, так утверждает OpenAI.
OpenAI планирует представить DALL-E 3 пользователям ChatGPT Plus и ChatGPT Enterprise в октябре этого года, а затем исследовательским лабораториям и клиентам API. Компания не сообщила, планирует ли она выпустить бесплатный веб-инструмент, как это было с DALL-E 2 и оригинальной моделью DALL-E.