Il 3 ottobre 2024, Google ha annunciato il lancio di Gemini 1.5 Flash-8B, la nuova variante del suo modello ottimizzato per la produzione. Questo modello è caratterizzato da un costo inferiore del 50% rispetto al suo predecessore, Gemini 1.5 Flash, e offre il doppio dei limiti di utilizzo, raggiungendo 4.000 richieste al minuto. Le migliorie non si fermano qui: la latenza sui prompt più brevi è stata ridotta, garantendo un’esperienza utente più fluida.
Gemini 1.5 Flash-8B è stato progettato per le esigenze degli sviluppatori, offrendo accesso gratuito tramite Google AI Studio e la Gemini API. Questa versione rappresenta un passo avanti significativo in termini di prestazioni, riuscendo a competere con il modello lanciato a maggio in vari benchmark. È particolarmente efficace in applicazioni come chat, trascrizione e traduzione linguistica di contesti lunghi.
Con un costo di soli $0,0375 per un milione di token di input, Gemini 1.5 Flash-8B offre il prezzo per intelligenza più basso tra i modelli Gemini. Il lancio di questo nuovo modello sottolinea l’impegno di Google nel fornire agli sviluppatori gli strumenti necessari per creare soluzioni innovative. La disponibilità per l’uso in produzione rappresenta un’opportunità significativa per le aziende e i professionisti del settore.