Добавить новость

Москвичей предупредили о сохранении непогоды в столице до конца суток

Дело «Вагнера» живёт и побеждает: Россия и Китай вытесняют США из Африки

Факультет менеджмента и маркетинга Евразийского международного университета проводит дополнительный набор абитуриентов на образовательную программу «ДОКТОР ДЕЛОВОГО АДМИНИСТРИРОВАНИЯ»!

Московские коммунальщики ликвидируют последствия непогоды



Новости сегодня

Новости от TheMoneytizer

Il modello text-to-video: i sample di Sora sono realmente ultra-realistici?

OpenAI ha pubblicato alcuni esempi. Per molti aspetti l'innovazione è impressionante, ma ci sono anche molti limiti

L'articolo Il modello text-to-video: i sample di Sora sono realmente ultra-realistici? proviene da Giornalettismo.

Un tempo erano i testi. Poi si è arrivati alle immagini e oggi, inevitabilmente, stiamo entrando nell’era dei video generati dall’intelligenza artificiale. La scorsa settimana, OpenAI ha iniziato a condividere sui social (e sul sito ufficiale) i primi esempi di ciò che il suo nuovo prodotto – chiamato “Sora” e ancora in fase di sviluppo – è in grado di fare. Basta un comando (dettagliato) per vedere sul proprio schermo il risultato scorrere davanti ai nostri schermi. Il funzionamento, dunque, sembra essere piuttosto semplice e proprio per questo sono già emerse le prime critiche e perplessità su molti fronti: dal mondo del cinema (per ovvi motivi), fino a quello dell’informazione.

LEGGI ANCHE > Siamo sicuri che Sora sia un passo verso il futuro?

La scelta del nome non è ancora stata spiegata né da OpenAI, né da Sam Altman. Le ipotesi al vaglio possono essere molti: in giapponese, l’ideogramma 空 (Sora) vuol dire “cielo” e, dunque, potrebbe essere questa la reference al concetto di vastità della libertà e di fantasia. Ma c’è anche chi pensa che si tratti di un acronimo, con varie ipotesi in ballo: “Speech Or Reality Augmentation” oppure “Storytelling Or Reality Architecture”. Per ora, però, si tratta solamente di ipotesi.

Sora, il text-to-video di OpenAI funziona veramente?

Sta di fatto che dopo tanti esperimenti che non hanno ancora raggiunto una “perfezione” vicina alla realtà, questo modello text-to-video (o video from text) sembra avere le carte in regola per entrare a gamba tesa all’interno di molti dei mondi che fanno delle immagini in movimento il proprio fulcro. Ma come funziona – o dovrebbe – questo strumento? Il tutto si esaurisce in tre semplici step:

  1. Descrizione testuale – anche attraverso un breve schema – in cui vengono spiegati i dettagli di ciò che si vuole vedere nel video (dall’ambiente circostante, ai personaggi – comprese le loro caratteristiche fisiche e di “personalità” – fino alle azioni che compiono le “telecamere”, per arrivare allo stile di ripresa).
  2. Scelta delle impostazioni, partendo dalla durata (per il momento, fino a 60 secondi) del video, passando per la qualità di definizione e altri parametri opzionali.
  3. Dare il via libera alla generazione del il video, con Sora che lavora basandosi sulle indicazioni dei primi due step per realizzare – nel giro di pochissimo tempo – un filmato.

Dunque, stando alla descrizione fatta da OpenAI tutto è estremamente semplice e immediato. Esattamente come ChatGPT, ma più preciso di ChatGPT.

I primi risultati

E i primi risultati sono stati pubblicati in un thread su X. Per il primo, il “prompt” utilizzato è il seguente: «Una Tokyo magnifica e innevata è in fermento. La telecamera si muove per le strade affollate della città, seguendo diverse persone che si godono la neve e fanno acquisti nelle vicine bancarelle. Splendidi petali di sakura volano nel vento insieme ai fiocchi di neve». Questo il risultato.

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) February 15, 2024

Anche il secondo, probabilmente per esaltare due stili architettonici che convivono nello stesso Paese, fa riferimento alla capitale giapponese: «Una donna elegante cammina lungo una strada di Tokyo piena di neon caldi e luminosi e di segnaletica animata della città. Indossa una giacca di pelle nera, un lungo vestito rosso e stivali neri e porta una borsa nera. Indossa occhiali da sole e rossetto rosso. Cammina con sicurezza e disinvoltura. La strada è umida e riflettente, creando un effetto specchio delle luci colorate. Molti pedoni camminano».

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq

— OpenAI (@OpenAI) February 15, 2024

Due esempi che mostrano le potenzialità che, al momento, non sono ancora a disposizione di tutti gli utenti. Si tratta, infatti, di un annuncio in cui si spiega che si è ancora in fase di controllo – soprattutto per capire come mitigare i rischi di deepfake – che ora sarà esteso ad alcune realtà che potranno maneggiare con cura questo nuovo prodotto AI.

I problemi

Questi due esempi (che fanno parte di un portfolio di video condivisi sui social e sul blog ufficiale di OpenAI), sembrano essere ultra-realistici. Dal punto di vista delle immagini lo sono, ma c’è qualcosa che non torna. Per esempio, nel primo filmato – quello della coppia – i “protagonisti” si trovano di fronte a un marciapiede che sembra essere un vicolo cieco. Nel secondo – così come nel primo – gli ideogrammi che compaiono lungo la “passeggiata” non fanno riferimento a parole o concetti reali nel vocabolario giapponese. Piccole, ma grandi pecche che rendono questo strumento (ancora in fase di sviluppo) ancora da migliorare.

L'articolo Il modello text-to-video: i sample di Sora sono realmente ultra-realistici? proviene da Giornalettismo.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Факультет менеджмента и маркетинга Евразийского международного университета проводит дополнительный набор абитуриентов на образовательную программу «ДОКТОР ДЕЛОВОГО АДМИНИСТРИРОВАНИЯ»!

Минтранс рассказал о дорожной обстановке в Московской области вечером 20 июня

Займы просрочили до самого ареста // Бывший совладелец «Трансфин-М» Алексей Тайчер отправлен в СИЗО

Московские коммунальщики ликвидируют последствия непогоды

Музыкальные новости

МОК не допустил до Олимпиады сильнейших борцов и тхэквондистов из России

В аэропорту Пулково задержали шесть рейсов и отменили еще один

Те самые русские с флагами на матче-открытия Евро — мы их нашли! Как попали на стадион и как реагируют вокруг?

Автопробег в честь Дня России прошел в Ленинском округе

Новости России

Вице-мэр Ракова сообщила о запуске поезда колледжей в столичном метрополитене

Почему это позволено в наших храмах?

Москва выходная: дартс, книжный клуб и мир под микроскопом

На форуме недвижимости «Движение» обсудили, как региональные девелоперы осваивают новые рынки

Экология в России и мире

Доктор Кутушов: не стоит носить кроссовки в жару

АФК «Система» планирует модернизировать Вологодский текстильный комбинат

Ирина Ортман оставляет в прошлом «Всё, что было вчера».

Tod's, коллекция menswear весна-лето 2025

Спорт в России и мире

Саснович победила на старте квалификации турнира WTA-500 в Берлине

Теннисисты Рублев, Хачанов и Самсонова не сыграют на Олимпиаде-2024

Лучший теннисист Казахстана узнал позицию в обновленном рейтинге ATP

Овечкин, Яковлев, Фридзон и Мыскина сыграли в падел-теннис в Турции: «Победила дружба»

Moscow.media

Чемпионат и Первенство Москвы и Московской области по автокроссу

Приморье. Взгляд.

Mishel Dar и его главный хит лета: «Лети»

Бесплатный билет в музеи Зеленоградска от «ПАРАDOX» и BelkaCar











Топ новостей на этот час

Rss.plus






Минтранс рассказал о дорожной обстановке в Московской области вечером 20 июня

Займы просрочили до самого ареста // Бывший совладелец «Трансфин-М» Алексей Тайчер отправлен в СИЗО

Москвичей предупредили о сохранении непогоды в столице до конца суток

Путин заявил, что Россия может изменить свою ядерную доктрину