OpenAI si prepara a concludere il 2024 con un’iniziativa speciale chiamata “shipmas“, un gioco di parole tra “shipping” e “Christmas”, che prevede 12 giorni consecutivi di annunci. Oggi OpenAI ha lanciato Sora, il suo generatore di video da testo dopo la presentazione delle sue capacità lo scorso febbraio. Le prime recensioni, in particolare quella di Marques Brownlee (MKBHD), rivelano un mix di meraviglia e preoccupazione. MKBHD è uno dei rari creatori e tester che hanno avuto accesso privilegiato a Sora nelle ultime settimane.
Il potenziale è enorme, ma le implicazioni sono profonde. Sora rappresenta un salto notevole nella generazione di contenuti video; trasforma semplici descrizioni testuali in sequenze video fluide e dettagliate. La piattaforma si distingue come prodotto autonomo, separato da ChatGPT.
Capacità tecniche e funzionalità di Sora
Sora si presenta con un’interfaccia che nasconde una potenza computazionale impressionante. Il sistema supporta risoluzioni fino a 1080p, con tempi di generazione che variano in base alla qualità richiesta.
La piattaforma eccelle nella creazione di animazioni astratte, effetti fluidi e scene in stile cartoon. I pirmi video mostrano una comprensione sorprendente delle texture e dei materiali. La funzionalità “Re-mix” permette di modificare video esistenti con nuovi elementi, mentre lo strumento “Storyboard” consente di concatenare più prompt per creare narrative visive complesse.
La generazione richiede alcuni minuti per un video in alta definizione. Questo tempo potrebbe aumentare con l’incremento degli accessi. Il sistema include, inoltre sofisticate protezioni etiche e filigrane digitali per contrastare potenziali abusi.
Tuttavia, Sora presenta anche alcune limitazioni presentate da Marques Brownlee nel suo video. Per esempio, il sistema mostra difficoltà nella gestione della fisica realistica. Oggetti attraversano inspiegabilmente altri oggetti o scompaiono improvvisamente. La rappresentazione del movimento umano risulta spesso poco naturale.
Inoltre, ci sono anche le restrizioni che includono il divieto di generare contenuti con minori, temi espliciti o violenti, e materiale protetto da copyright. Il sistema rifiuta automaticamente prompt contenenti personaggi pubblici o loghi commerciali.
Modalità di accesso e abbonamenti
Piano Base:
- Disponibile tramite ChatGPT Plus a $20 mensili
- Generazione fino a 50 video
- Durata massima di soli 20 secondi per video
Piano avanzato:
- Incluso nell’abbonamento ChatGPT Pro (200$ mese)
- Risoluzione superiore
- Video di maggiore durata
- Funzionalità aggiuntive
- Supporto per video in Full HD (1920×1080 pixel)
- Possibilità di generare contenuti in diversi formati e aspect ratio
- Capacità di scalare da bassa a alta risoluzione per anteprima e rendering finale
- Durata massima estesa fino a 60 secondi per video
- Possibilità di estendere video esistenti sia in avanti che indietro nel tempo
- Creazione di loop video infiniti
- Inpainting avanzato per modificare elementi specifici nei video
- Controllo preciso di camera e animazione degli oggetti
- Effetti di zoom infinito e transizioni
- Morphing tra scene diverse
- Animazione automatica di sottotitoli e testo
- Capacità di convertire immagini statiche in video
- Integrazione di elementi illustrati nel footage reale
Conclusioni
Le capacità attuali di Sora, pur con evidenti limitazioni, lasciano sperare che la creazione di contenuti video diventerà più accessibile e versatile. Per un elenco con i paesi dove sarà disponibile, qui. Purtroppo i paesi dell’UE sono esclusi per ora dall’accesso. Il servizio è accessibile tramite Sora.com