DeepSeek continua a rivoluzionare il panorama dell’intelligenza artificiale con il rilascio della serie DeepSeek-R1. Disponibili su Hugging Face con licenza MIT, i modelli R1 e R1-Zero segnano un passo avanti nelle capacità di ragionamento avanzato.
DeepSeek-R1-Zero, addestrato esclusivamente tramite apprendimento di rinforzo (RL) senza messa a punto supervisionata (SFT), rappresenta una pietra miliare nel settore. Questo approccio ha permesso al modello di sviluppare comportamenti avanzati come la catena di pensiero (CoT) e l’autoverifica. Tuttavia, per superare le limitazioni legate a leggibilità e coerenza, l’azienda ha introdotto DeepSeek-R1, che combina dati di avvio a freddo e RL per ottenere prestazioni allineate a quelle di OpenAI-o1 su matematica, codice e ragionamento.
Un punto forte della serie è l’accessibilità. DeepSeek ha rilasciato versioni distillate, con parametri ridotti (da 1,5 a 70 miliardi), ottimizzate per hardware meno performanti. Questo consente di utilizzare il modello anche su laptop, rendendolo versatile e democratico.
In termini di benchmark, DeepSeek-R1 e i suoi distillati superano i concorrenti su test come MATH-500, AIME e SWE-bench, dimostrando risultati all’avanguardia. La pipeline di sviluppo combina due fasi RL e due SFT, garantendo un equilibrio tra capacità di ragionamento e allineamento con le preferenze umane.
La piattaforma DeepSeek fornisce anche API compatibili con OpenAI e supporto tecnico per l’esecuzione locale dei modelli. Gli sviluppatori possono testare DeepSeek-R1 tramite strumenti come vLLM o SGLang, seguendo le raccomandazioni ufficiali per massimizzare le prestazioni.
Con licenza open source, DeepSeek-R1 apre nuove strade per l’intelligenza artificiale, rendendo tecnologie avanzate accessibili a ricercatori e aziende di ogni dimensione.