Alibaba ha annunciato il rilascio di Wan 2.1, un avanzato modello di intelligenza artificiale open-source per la generazione di video. Questo strumento consente agli utenti di creare video realistici a partire da descrizioni testuali, immagini o altri video. La versione T2V-1.3B di Wan 2.1 è ottimizzata per funzionare su GPU di fascia consumer, richiedendo solo 8,19 GB di VRAM e permettendo la generazione di video in 480p di 5 secondi in circa 4 minuti su una RTX 4090.
Wan 2.1 si distingue per la sua versatilità, supportando diverse funzionalità come la generazione di video da testo (Text-to-Video), la conversione di immagini in video (Image-to-Video), l’editing video, la creazione di immagini da testo (Text-to-Image) e la generazione di audio da video (Video-to-Audio). Inoltre, è il primo modello video in grado di generare testo visivo sia in cinese che in inglese, ampliando le sue applicazioni pratiche.
Il rilascio open-source di Wan 2.1 rappresenta una mossa strategica di Alibaba per promuovere l’adozione della tecnologia AI e stimolare l’innovazione nel settore. Tuttavia, l’accessibilità del modello solleva preoccupazioni riguardo all’uso improprio, come la creazione di deepfake non consensuali e contenuti pornografici, evidenziando la necessità di implementare salvaguardie e limitazioni per prevenire abusi.
Gli sviluppatori e i ricercatori interessati possono accedere al codice sorgente e ai modelli pre-addestrati di Wan 2.1 attraverso le piattaforme GitHub e Hugging Face, favorendo ulteriori sviluppi e personalizzazioni.
Fonti: