Un nuovo traguardo nell’intelligenza artificiale è stato raggiunto da Google DeepMind, con il lancio di un nuovo agente di intelligenza artificiale polivalente per ambienti virtuali 3D. L’agente, chiamato Scalable Instructable Multiworld Agent (SIMA), è stato progettato per comprendere istruzioni in linguaggio naturale e compiere compiti in una varietà di ambientazioni di videogiochi.
Secondo quanto riportato nel rapporto tecnico pubblicato, SIMA è stato addestrato su una serie di giochi in collaborazione con otto studi di sviluppo di videogiochi. Ciò rappresenta la prima volta che un agente dimostra di poter comprendere un’ampia gamma di mondi videoludici e di seguire istruzioni in linguaggio naturale per eseguire compiti al loro interno, come farebbe un essere umano.
Questo traguardo non riguarda solo il raggiungimento di punteggi elevati nei giochi, ma piuttosto il potenziale di creare agenti di intelligenza artificiale più utili in qualsiasi ambiente. SIMA è in grado di interagire con un’ampia varietà di ambienti virtuali utilizzando una semplice interfaccia, composta da immagini sullo schermo e istruzioni in linguaggio naturale fornite dall’utente.
SIMA è stato valutato su oltre 600 abilità di base, tra cui navigazione, interazione con gli oggetti e utilizzo dei menu. Gli sviluppatori mirano a far evolvere SIMA affinché possa affrontare compiti che richiedono pianificazione strategica a livello elevato e l’esecuzione di più sottocompiti.
Il successo di SIMA nei test dimostra il potenziale per lo sviluppo di una nuova generazione di agenti di intelligenza artificiale polivalenti e guidati dal linguaggio. Tuttavia, sono necessarie ulteriori ricerche per migliorare le capacità di SIMA e renderlo in grado di eseguire compiti più complessi.