Компания OpenAI запустила нейросеть, которая генерирует реалистичные видео по текстовому описанию. Разработка получила название Sora в честь японского слова "небо".
Главное отличие Sora от аналогичных существующих моделей заключается в том, что она генерирует целые видео сразу, вместо того, чтобы объединять их покадрово. Пользователи смогут создавать ролики с разрешением до 1080p, продолжительностью до 20 секунд и в широкоэкранном, вертикальном или квадратном форматах, пишет The Verge.
В OpenAI подчеркнули, что при генерации Sora учитывает физические свойства объектов и их взаимодействие друг с другом, благодаря чему получаются натуральные видеоролики с естественными анимациями. Причем чем конкретнее подсказки пользователя, тем более реалистичным будет результат.
Примечательно, что инструмент запущена не в рамках ChatGPT, платформы чат-ботов OpenAI, а на отдельном сайте. Пока у Sora нет бесплатной версии, предлагаются два платных тарифа – фактически это подписки на ChatGPT:
Доступ к Sora откроется в ближайшее время всем пользователям. Многие уже могут ее протестировать.
Sora – не первая нейросеть, генерирующая реалистичные видео по тексту. Летом 2023 года создатели Stable Diffusion открыли доступ к своей новой нейросети Gen-2. Она тоже создает видеоролики по текстовому описанию, серии фотографий или на основе другого видео. Но качество роликов и детализация объектов остается невысоким.