Google introduce la generazione di immagini native con Gemini 2.0 Flash per sviluppatori su AI Studio, offrendo nuove funzionalità multimodali avanzate.
A partire da oggi, gli sviluppatori possono sperimentare la generazione di immagini native con Gemini 2.0 Flash, un modello avanzato di Google DeepMind. La nuova funzione, precedentemente disponibile solo per tester selezionati, è ora accessibile su Google AI Studio e tramite la Gemini API.
Gemini 2.0 Flash si distingue per l’integrazione tra testo e immagini, consentendo di generare illustrazioni coerenti per storie e contenuti. Inoltre, permette la modifica conversazionale delle immagini, mantenendo il contesto attraverso più interazioni.
Una caratteristica chiave del modello è la sua capacità di comprendere il mondo e applicare un ragionamento avanzato per creare immagini dettagliate e realistiche, ideali per illustrazioni di ricette o contesti complessi. Inoltre, migliora il rendering del testo rispetto ai modelli concorrenti, risultando efficace per la creazione di contenuti pubblicitari e post per i social media.
Questa evoluzione segna un passo importante nella generazione di immagini AI, rendendo l’integrazione tra linguaggio e grafica sempre più fluida e accessibile agli sviluppatori.
Fonti:
- Developers.googleblog
- Google DeepMind: deepmind.google
- Google AI Studio: ai.google.dev