Google Labs ha lanciato negli Stati Uniti un nuovo strumento innovativo basato sull’intelligenza artificiale generativa: Whisk. Questo esperimento consente agli utenti di esplorare idee visive in modo rapido e divertente, eliminando la necessità di lunghi prompt testuali. Whisk si distingue per la possibilità di generare immagini a partire da input visivi: basta trascinare e rilasciare tre immagini – per soggetto, scena e stile – per creare un risultato unico e personalizzato.
Tra gli esempi forniti, un tricheco in costume da bagno o un fantastico pesce-città dimostrano l’enorme potenziale creativo di Whisk. Il processo sfrutta il modello Gemini per generare descrizioni dettagliate delle immagini inserite, che vengono poi elaborate da Imagen 3, l’ultimo modello di generazione di immagini di Google. Questo approccio punta a catturare l’essenza dell’idea visiva, piuttosto che una replica esatta.
Whisk è stato progettato per ispirare e facilitare un’esplorazione creativa. Non si propone come un editor tradizionale, bensì come uno strumento per sperimentare rapidamente e con leggerezza, lasciando spazio a modifiche e remix. Tuttavia, Google riconosce che alcune caratteristiche specifiche potrebbero non corrispondere alle aspettative dell’utente, motivo per cui è possibile affinare i risultati manualmente.
Durante i test iniziali, artisti e creativi hanno accolto positivamente Whisk, definendolo una nuova frontiera per la progettazione visiva. Al momento, l’accesso è limitato agli Stati Uniti tramite il sito labs.google/whisk. Google invita gli utenti a condividere il proprio feedback per migliorare ulteriormente questa tecnologia, parte di un più ampio programma sperimentale che include altri modelli avanzati come Gemini e Veo.
Con Whisk, Google Labs segna un ulteriore passo avanti verso un futuro in cui l’intelligenza artificiale amplifica la creatività umana.