Sora, la nuova tecnologia text-to-video di OpenAI che rivoluziona la creazione di contenuti visivi
OpenAI lunedì ha reso disponibile Sora, un generatore di video a partire da testi scritti. Dal febbraio scorso, quando era stato lanciato, fino a qualche giorno fa, l’accesso era limitato a un gruppo selezionato di artisti e tester, mentre ora è aperto a tutti gli utenti di ChatGPT Plus e Pro senza costi aggiuntivi.
OpenAI rende noto che sta lavorando anche allo sviluppo di una versione gratuita, che vedrà la luce in futuro. Lo strumento generativo si dimostra comunque subito apprezzato, tanto da far registrare un notevole traffico web appena rilasciato. «Stiamo lavorando su una tariffazione personalizzata per diversi tipi di utenti, che speriamo di rendere disponibile all’inizio del prossimo anno», dichiara l’azienda.
Sora è il modello text-to-video di OpenAI che consente di generare video realistici partendo dai prompt scritti dagli utenti. Permette di creare video fino a 1080p di risoluzione con una durata massima di 20 secondi, scegliendo tra differenti formati. È possibile caricare i propri contenuti per rielaborarli, oppure generarne di completamente nuovi grazie a interfacce studiate per l’inserimento dei contenuti e per poter specificare gli input per ogni fotogramma.
Sora, che si inserisce nell’ambito delle tecnologie IA multimodali, nella sua versione “Turbo” appena rilasciata è più performante della prima versione di febbraio e mira a rivoluzionare la creazione di contenuti video in modo semplice e innovativo. «Ci auguriamo che questa versione iniziale di Sora permetta alle persone di tutto il mondo di esplorare nuove forme di creatività, raccontare le proprie storie e spingere i confini di ciò che è possibile con la narrazione video», afferma OpenAI, che dichiara inoltre: «Sora è uno strumento capace di comprendere e simulare la realtà, un passo importante verso la creazione di modelli in grado di interagire con il mondo fisico».
Aggiunge Sam Altman, CEO di OpenAI: «Il modello è in grado di comprendere l’esistenza di oggetti nel mondo fisico e interpreta accuratamente le istruzioni per generare personaggi convincenti che esprimono emozioni vibranti».
OpenAI, però, sta ancora lavorando per garantire la conformità con le normative come la Online Safety Act nel Regno Unito e il Digital Services Act e il GDPR nell’UE: Sora è disponibile, infatti, nella maggior parte dei Paesi in cui sono presenti anche gli altri prodotti dell’azienda, come gli Stati Uniti, ma non nel Regno Unito o in Europa. OpenAI, infatti, potrà distribuire il nuovo modello solo quando sarà in regola con le normative comunitarie sulla privacy e sull’intelligenza artificiale.
L’azienda è famosa per lo sviluppo di ChatGPT, ma Sora non sembra essere una funzione integrata in questo chatbot, ma uno strumento a parte con un proprio indirizzo web. L’azienda con questo lancio torna a essere capofila del settore dell’intelligenza artificiale generativa, ampliando la propria offerta di strumenti IA e facendo salire la propria valutazione economica fino a 160 milioni di dollari.
Sora rientra in un’iniziativa speciale di OpenAI chiamata “Shipmas” (fusione di ship e Christmas), che prevede nel periodo natalizio il lancio di nuovi strumenti e funzioni basati su IA per dodici giorni, fino al 20 dicembre prossimo, con annunci in live stream.
Alcuni artisti, però, accusano OpenAI di fare art washing, ovvero di lanciare un prodotto che potrebbe minacciare il loro lavoro, ma costruirne una narrazione positiva associandosi a dei creativi per promuoverlo. Secondo Reece Hayden, analista senior presso la società di ricerche di mercato ABI Research, questi modelli di intelligenza artificiale, infatti, potrebbero avere un grande impatto sui mercati dell’intrattenimento digitale, creando nuovi contenuti personalizzati trasmessi in streaming. Sora presenta quindi alcune limitazioni etiche, visto il suo impatto sull’industria cinematografica e artistica e sui risvolti in termini di privacy e sicurezza.
Nonostante l’ottima resa dell’IA generativa per gli effetti stilistici o per i paesaggi, questa tecnologia continua a essere imperfetta, generando video spesso con distorsioni irrealistiche o presentando difficoltà nel creare sequenze complesse e di lunga durata. OpenAI afferma che comunque continuerà a lavorare per affinare il modello. Per circoscrivere le minacce della disinformazione e dei deepfake, OpenAI dichiara che limiterà inizialmente il caricamento di immagini di persone specifiche e bloccherà contenuti dannosi, come i deepfake, per evitare usi impropri, fino a quando non saranno perfezionate le contromisure.
L’azienda specifica: «La “funzione likeness” è attualmente disponibile solo come funzionalità pilota per un piccolo gruppo di primi tester. Per affrontare le preoccupazioni relative all’appropriazione indebita di somiglianze e deepfake, abbiamo impostato standard di moderazione particolarmente rigidi per i caricamenti che presentano persone e continuiamo a bloccare i contenuti con nudità. Gli utenti che hanno accesso a questa funzionalità visualizzeranno anche promemoria nel prodotto sulle nostre policy, incluso ciò che è consentito e ciò che non lo è. Monitoreremo attivamente i modelli di uso improprio e, quando li troveremo, rimuoveremo il contenuto, adotteremo misure appropriate e utilizzeremo questi primi apprendimenti per iterare il nostro approccio alla sicurezza».
Tutti i video generati con Sora includono i metadati C2PA, che identificano un video come proveniente da IA per garantire la trasparenza e verificarne l’origine. Scrive OpenAI: «Abbiamo aggiunto misure di protezione come filigrane visibili di default e sviluppato uno strumento di ricerca interno che utilizza attributi tecnici per aiutare a verificare se il contenuto proviene da Sora. Sono presenti anche filtri di sicurezza per mitigare il fenomeno del deepfake e classificatori di immagini adoperati per rivedere i fotogrammi di ogni contenuto generato assicurandosi che aderisca alle policy di utilizzo di OpenAI prima che venga mostrato all’utente».
Riproduzione: Italiaeconomy.it