Nel gennaio 2025, DeepSeek ha lanciato Janus Pro, un avanzato modello di intelligenza artificiale multimodale che migliora significativamente le capacità del suo predecessore, Janus. L’aggiornamento si distingue per una maggiore potenza computazionale, dati di training ampliati e un’architettura innovativa che ottimizza la comprensione e la generazione di contenuti visivi e testuali.
Uno degli elementi chiave di Janus Pro è il design disaccoppiato della codifica visiva, che separa le funzioni di comprensione e generazione, permettendo prestazioni più efficienti. Questa caratteristica consente al modello di ottenere risultati superiori rispetto agli encoder visivi tradizionali.
I test di riferimento confermano l’efficacia del nuovo modello: Janus-Pro-7B ha raggiunto una precisione dell’84,5% nella comprensione multimodale e un punteggio di 8,7/10 nella qualità della generazione. Inoltre, Janus Pro dimostra competenze avanzate nella conversione di formule matematiche e nella creazione di immagini, ampliando le possibilità applicative nel campo dell’IA generativa.
DeepSeek ha anche introdotto JanusFlow, un ecosistema tecnico che integra modelli autoregressivi con tecniche di flusso rettificato, favorendo una maggiore coesione tra i diversi formati di dati elaborati. In linea con la filosofia open-source, il codice di Janus Pro è disponibile su GitHub, con una licenza che ne consente l’utilizzo anche in ambito commerciale.
Il rilascio di Janus Pro rappresenta una svolta nell’IA multimodale, aprendo nuove prospettive per la ricerca e le applicazioni in settori come la comunicazione visiva, l’educazione e l’industria creativa. Con un futuro sempre più orientato all’integrazione tra testo e immagine, DeepSeek si posiziona come uno dei leader nell’innovazione dell’intelligenza artificiale.