Sky-T1-32B: Il Futuro dell’AI Open Source di NovaSky

Il team NovaSky presso lo Sky Computing Lab dell’UC Berkeley ha presentato il loro nuovo modello di ragionamento, Sky-T1-32B-Preview. Questo modello completamente open source è stato addestrato con Qwen2.5-32B-Instruct utilizzando 17K dati, e le sue prestazioni sono alla pari con il modello o1-preview nei benchmark di ragionamento e codifica più diffusi.

L’aspetto sorprendente di Sky-T1-32B-Preview è che il costo di addestramento è inferiore ai 450 dollari, un risultato notevole considerando le capacità avanzate del modello. Il co-fondatore di NovaSky, Aymeric Vaudelin, ha spiegato che l’idea era di sviluppare un modello di ragionamento avanzato accessibile e altamente performante. “Abbiamo utilizzato Llama-Factory per l’addestramento e DeepSpeed Zero-3 Offload, completando la formazione in 19 ore,” ha affermato Vaudelin.

Il modello ha beneficiato di 17K risposte corrette verificate, insieme a dati scientifici aggiunti dal paper Still-2. Questa combinazione ha permesso al modello di eccellere in campi come la matematica e la codifica. La messa a punto supervisionata sui dati ha utilizzato una dimensione del batch pari a 96, ottimizzando l’efficienza del processo di formazione.

Sky-T1-32B-Preview rappresenta un passo avanti significativo per l’innovazione AI, permettendo a ricercatori e sviluppatori di accedere a un modello di ragionamento avanzato senza un costo proibitivo. NovaSky continua a spingere i confini della tecnologia AI, offrendo soluzioni innovative e accessibili.

Per maggiori dettagli, è possibile consultare il post sul blog di NovaSky, che fornisce una panoramica completa dei risultati ottenuti e delle future direzioni di ricerca.

NEWS AIopenmind su:

3D (8)6G (1)Accademia di Comunicazione (4)Acer (1)Adobe (40)Aeronautica (10)Africa (3)Agenti AI (3)Agenti autonomi (1)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (10)AGID (1)Agricoltura (1)Amazon (43)Ambiente (3)AMD (2)Android (6)Animali (6)Animazione (4)Anthropic (26)Anziani (1)App (11)Apple (68)Archeologia (3)Architettura (4)Archivi storici (1)Armi (3)Arredamento interni (2)Arte (30)Assistente vocale (6)Astronomia (2)Asus (2)AT&T (1)Audi (1)Audio (57)Autoapprendimento (1)Avatar (7)Aviazione (1)Avvocati (2)Aziende (20)Banca (4)Bard (3)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)Canva (7)Cattolicesimo (3)Certificazioni (1)Cesintes (1)chataudio (1)Chatbot IA (53)Chip (3)Cina (59)Cinema (11)Claude (20)Clima (4)CNR (1)Coca-Cola (1)Commercio (2)Commissione Europea (2)Compagnie aeree (1)Computer (5)Computer quantistici (34)Computer Vision (3)Comuni italiani (1)Comunicazione (10)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (1)Contabilità (2)Convegno (13)Copilot (6)Copyright (15)Criptovalute (1)Cybersecurity (2)Dalle-2 (3)Dark web (3)Data center (6)Dating (1)Deepfake (3)Design automobilistico (2)Design Industriale (6)Diritti Autore (1)Disney (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)eBay (1)Editing fotografico (3)Editoria (13)Email (1)ENEA (2)Esercito (2)Etica (142)Europol (1)Eventi (7)Evento (8)Facebook (4)FakeNews (18)Falegnameria (1)Fauna selvatica (1)Film (6)Finanza (10)Finanziamenti Italia (4)Firefly (3)Firefox (1)Fondo Monetario Internazionale (1)Formazione (23)Fotografia (112)Francia (1)Free lance (1)G7 (1)Gaming (1)Garante privacy (20)Giappone (9)Giochi (9)Giornalismo (21)Giustizia (2)Google (350)Governo (7)Governo Italiano (3)Grafica (6)Guerra (12)Guida autonoma (6)Hong Kong (1)Hugging Face (3)IBM (8)Illustrazioni (1)iMessage (1)Immobiliare (1)India (3)Indossabili (4)Influencer (1)Informazione (10)Inghilterra (8)INPS (2)Intel (7)ISO (1)Istruzione (17)Jailbreaking (1)Kamala Harris (1)Lavoro (50)Libri (3)Linguistica computazionale (9)Linkedin (8)Linux (1)Luma AI (1)Maltrattamento infantile (1)Marina (1)Marketing (86)Medicina (32)Mercedes-Benz (1)Meta (105)Metaverso (17)Meteo (1)Microsoft (200)Midjourney (18)Mobilità sostenibile (2)Moda (6)Modelli AI (65)Motori di Ricerca (13)Mozilla (2)Museo (1)Musica (40)NASA (1)Nato (2)Natura (2)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (47)Occhiali (7)Occhiali Intelligenti (2)Occhiali Smart (1)Oculistica (1)Odore (1)OMS (1)ONU (1)Open Source (3)OpenAI (293)Opera (13)Opera Browser (1)Oppo (3)Oracle (2)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (10)Pianeta (2)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

Nvidia Sotto Pressione: Nuove Restrizioni USA Minacciano i Ricavi

Nvidia si trova ad affrontare una minaccia significativa ai suoi ricavi a causa delle nuove restrizioni statunitensi all'esportazione di chip per l'intelligenza artificiale, secondo...

Mi sono imparato la scienza?

Fahrenheit.iit e il potere della narrazione. Mercoledì 13 marzo, ore 17:00 in Accademia di Comunicazione e in streaming Registrati La narrazione può essere la lama...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines