DeepMind presenta Genie 2, un modello di base rivoluzionario capace di generare una varietà infinita di ambienti 3D interattivi per l’addestramento e la valutazione di agenti IA. Partendo da una singola immagine, Genie 2 crea mondi giocabili tramite input da tastiera e mouse, aprendo nuove prospettive per la ricerca sull’intelligenza artificiale.
I giochi hanno sempre avuto un ruolo cruciale nello sviluppo dell’IA, offrendo sfide complesse e progressi misurabili. Genie 2 supera i limiti dei tradizionali ambienti di addestramento, offrendo un curriculum illimitato di nuovi mondi. Questo modello mondiale simula ambienti virtuali, prevedendo le conseguenze di ogni azione, come saltare o nuotare. Addestrato su un vasto set di dati video, Genie 2 mostra capacità emergenti come l’interazione con oggetti, animazioni complesse, fisica e la modellazione del comportamento di altri agenti.
Partendo da un’immagine generata da Imagen 3 (il modello testo-immagine di DeepMind), Genie 2 permette a chiunque di descrivere un mondo testualmente, visualizzarlo e interagire con esso, addestrandovi agenti IA. Il modello risponde intelligentemente agli input da tastiera, animando personaggi e oggetti in modo coerente. Genie 2 offre anche la generazione di controfattuali, la memoria a lungo orizzonte, la generazione di video lunghi e la creazione di diverse prospettive (prima persona, isometrica, terza persona).
Questa tecnologia semplifica la prototipazione rapida di esperienze interattive, consentendo ai ricercatori di sperimentare nuovi ambienti e accelerando il processo creativo per artisti e designer. Genie 2 rappresenta un passo avanti fondamentale verso l’intelligenza artificiale generale (AGI).
Punti chiave:
- Generazione di mondi 3D: Genie 2 crea ambienti virtuali interattivi e giocabili da una singola immagine.
- Addestramento di agenti IA: Offre un curriculum illimitato di ambienti per l’addestramento e la valutazione.
- Capacità emergenti: Interazione con oggetti, animazioni, fisica, modellazione del comportamento di altri agenti.
- Prototipazione rapida: Semplifica la creazione di nuove esperienze interattive per ricercatori, artisti e designer.
- Tecnologia: Modello autoregressivo di diffusione latente addestrato su un vasto dataset video.