OpenAI ha recentemente pubblicato una versione ampliata della sua “Model Spec“, un documento che definisce il comportamento dei suoi modelli di intelligenza artificiale. La nuova specifica, estesa a 63 pagine rispetto alle precedenti 10, stabilisce linee guida su come i modelli dovrebbero gestire argomenti controversi e la personalizzazione dell’utente. I tre principi fondamentali evidenziati sono: personalizzazione, trasparenza e “libertà intellettuale”, intesa come la capacità degli utenti di esplorare e discutere idee senza restrizioni arbitrarie.
Questo aggiornamento arriva mentre il CEO Sam Altman ha annunciato il prossimo rilascio del modello GPT-4.5, nome in codice Orion. La nuova Model Spec incorpora dibattiti etici recenti sull’IA, incoraggiando i modelli a “cercare la verità insieme” con gli utenti, mantenendo al contempo posizioni morali chiare su questioni come la disinformazione o il potenziale danno. Ad esempio, su temi come l’aumento delle tasse per i ricchi, i modelli sono ora incoraggiati a fornire un’analisi ragionata piuttosto che evitare la discussione.
Un cambiamento significativo riguarda la gestione dei contenuti per adulti. Dopo feedback da utenti e sviluppatori che richiedevano una “modalità per adulti”, il team sta esplorando modi per consentire determinati tipi di contenuti per adulti in contesti appropriati, mantenendo rigidi divieti su contenuti dannosi come il revenge porn o i deepfake. Questo rappresenta una svolta rispetto alle precedenti restrizioni generali dell’azienda sui contenuti espliciti.
La specifica introduce anche una chiara “catena di comando” che definisce quali istruzioni hanno la priorità: le regole a livello di piattaforma di OpenAI vengono prima, seguite dalle linee guida degli sviluppatori e poi dalle preferenze degli utenti. Questa gerarchia mira a chiarire quali aspetti del comportamento dell’IA possono essere modificati rispetto alle restrizioni che rimangono fisse. OpenAI ha rilasciato la specifica con una licenza Creative Commons Zero (CC0), rendendola di fatto di pubblico dominio, permettendo ad altre aziende e ricercatori di adottare, modificare o basarsi su queste linee guida.
Sebbene l’annuncio non modifichi immediatamente il comportamento di ChatGPT o di altri prodotti OpenAI, l’azienda afferma che rappresenta un progresso continuo nel far sì che i suoi modelli seguano costantemente questi principi. OpenAI sta sollecitando il feedback pubblico sulla specifica tramite un modulo sul suo sito web, sottolineando l’importanza di portare le discussioni interne al pubblico per un feedback costruttivo.