Stability AI ha recentemente annunciato l’introduzione del loro ultimo modello di intelligenza artificiale, Stable Video 4D, una tecnologia rivoluzionaria che trasforma un singolo video in molteplici visuali dinamiche da otto angolazioni diverse. Questo avanzamento tecnologico rappresenta un salto significativo rispetto ai modelli precedenti di generazione video basati su immagini, spostando l’attenzione verso una sintesi video 3D completa.
Stable Video 4D è in grado di generare video di cinque fotogrammi attraverso otto angolazioni in circa 40 secondi. Gli utenti possono specificare gli angoli della telecamera, personalizzando così l’output per soddisfare esigenze creative specifiche. Attualmente, il modello è disponibile su Hugging Face e si trova nella sua fase di ricerca, con applicazioni future previste nei settori dello sviluppo di giochi, montaggio video e realtà virtuale.
Il funzionamento del modello è semplice: gli utenti caricano un video singolo e specificano le pose della telecamera in 3D desiderate. Stable Video 4D genera quindi otto nuovi video seguendo le visuali indicate, offrendo una prospettiva multi-angolare completa del soggetto. Questa capacità di visualizzare oggetti da molteplici prospettive è un vantaggio significativo per i professionisti, migliorando il realismo e l’immersione nei loro prodotti.
Una delle caratteristiche distintive di Stable Video 4D è la sua capacità di mantenere la coerenza spaziale e temporale attraverso le diverse visuali e fotogrammi, senza la necessità di complessi modelli di diffusione multipla. Questo approccio non solo garantisce un’apparenza uniforme dell’oggetto, ma rende il processo di ottimizzazione 4D più leggero.
Il team di Stability AI è impegnato nell’innovazione continua, esplorando casi d’uso reali e affinando il modello per gestire un’ampia gamma di video del mondo reale. Con il continuo sviluppo e l’adozione di questa tecnologia, si prevede un vasto potenziale nella creazione di video multi-angolari realistici.