На международной конференции AI Journey Сбер представил бета-версию нейросети нового поколения Kandinsky 4.0 Video, которая позволяет создавать реалистичные видеоролики по текстовому описанию или стартовому кадру. Это открытие будет полезно не только обычным пользователям, но и профессионалам — дизайнерам, маркетологам и мультипликаторам.
Новая версия модели значительно улучшила качество и скорость генерации видеороликов по сравнению с предыдущими версиями. Пользователи теперь могут создавать видеоряд продолжительностью до 12 секунд в разрешении HD (1280×720). Модель позволяет генерировать видео с разным соотношением сторон для различных нужд. Одним из ключевых улучшений стала высокая четкость кадров и реалистичность движений генерируемых объектов, чего удалось достичь благодаря совместной работе научных и инженерных команд.
Для ускоренной генерации видео представлена версия Kandinsky 4.0 Video Flash, которая за 15 секунд создает видеоряд продолжительностью до 12 секунд в разрешении 480p. Эта версия особенно подойдет для быстрого создания коротких видеороликов.
Модель Kandinsky 4.0 Video была разработана командой Sber AI в сотрудничестве с Институтом AIRI, и доступ к ней первым получат художники, дизайнеры и кинематографисты. В течение 2025 года нейросеть станет доступна широкой аудитории.