CriticGPT: Il Cacciatore di Errori di ChatGPT

OpenAI ha annunciato lo sviluppo di un modello innovativo chiamato CriticGPT, basato su GPT-4, progettato per individuare e correggere gli errori nelle risposte generate da ChatGPT. CriticGPT è stato addestrato per scrivere critiche dettagliate sui risultati di ChatGPT, facilitando il compito degli addestratori umani nel rilevare inesattezze durante il processo di Reinforcement Learning from Human Feedback (RLHF).

Il modello CriticGPT ha dimostrato di essere estremamente efficace: gli utenti che utilizzano CriticGPT per revisionare il codice di ChatGPT ottengono prestazioni migliori rispetto a quelli che operano senza il suo supporto, con un miglioramento del 60% delle loro prestazioni. Questo strumento viene ora integrato nel processo di etichettatura di RLHF, offrendo un’assistenza esplicita agli addestratori umani.

Uno dei principali vantaggi di CriticGPT è la sua capacità di rilevare errori che potrebbero sfuggire all’occhio umano, soprattutto man mano che ChatGPT diventa sempre più accurato e le sue inesattezze più sottili. CriticGPT è stato addestrato su un ampio numero di input contenenti errori, che doveva poi criticare. Questo processo ha permesso di migliorare significativamente la qualità delle critiche prodotte dal modello.

Secondo gli studi condotti, le critiche di CriticGPT sono preferite dai trainer umani nel 63% dei casi, grazie alla riduzione delle “piccolezze” e delle allucinazioni di problemi. Inoltre, utilizzando una ricerca avanzata durante il test, è possibile bilanciare l’aggressività con cui vengono cercati i problemi nel codice, migliorando la precisione delle critiche prodotte.

Nonostante i progressi, CriticGPT presenta ancora alcune limitazioni, soprattutto nel trattare compiti complessi o risposte lunghe. Tuttavia, OpenAI è impegnata a migliorare ulteriormente questo strumento, con l’obiettivo di sviluppare metodi in grado di aiutare i trainer a comprendere e valutare anche i compiti più articolati.

NEWS AIopenmind su:

3D (5)6G (1)Accademia di Comunicazione (4)Acer (1)Adobe (30)Aeronautica (9)Africa (2)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (4)AGID (1)Amazon (25)Ambiente (1)AMD (1)Android (5)Animali (6)Animazione (4)Anthropic (3)Anziani (1)App (10)Apple (50)Archeologia (3)Architettura (4)Armi (3)Arredamento interni (2)Arte (26)Assistente vocale (3)Astronomia (2)Asus (1)AT&T (1)Audi (1)Audio (50)Autoapprendimento (1)Avatar (3)Aviazione (1)Avvocati (2)Aziende (18)Banca (3)Bard (3)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)Canva (4)Cattolicesimo (3)Certificazioni (1)Cesintes (1)chataudio (1)Chatbot IA (41)Chip (3)Cina (52)Cinema (4)Claude (16)Clima (3)CNR (1)Coca-Cola (1)Commercio (2)Commissione Europea (1)Compagnie aeree (1)Computer (2)Computer quantistici (30)Computer Vision (3)Comuni italiani (1)Comunicazione (9)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (1)Contabilità (1)Convegno (13)Copilot (5)Copyright (11)Criptovalute (1)Cybersecurity (1)Dalle-2 (3)Dark web (2)Dating (1)Deepfake (2)Design automobilistico (2)Design Industriale (6)Diritti Autore (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)eBay (1)Editing fotografico (2)Editoria (9)Email (1)ENEA (2)Esercito (2)Etica (117)Europol (1)Eventi (5)Evento (7)Facebook (3)FakeNews (18)Falegnameria (1)Fauna selvatica (1)Film (2)Finanza (7)Finanziamenti Italia (3)Firefly (3)Fondo Monetario Internazionale (1)Formazione (11)Fotografia (94)Francia (1)Free lance (1)G7 (1)Gaming (1)Garante privacy (19)Giappone (9)Giochi (6)Giornalismo (10)Giustizia (1)Google (228)Governo (7)Governo Italiano (2)Grafica (5)Guerra (12)Guida autonoma (3)Hong Kong (1)Hugging Face (3)IBM (6)Illustrazioni (1)iMessage (1)Immobiliare (1)India (3)Indossabili (2)Influencer (1)Informazione (9)Inghilterra (6)INPS (2)Intel (5)ISO (1)Istruzione (16)Jailbreaking (1)Kamala Harris (1)Lavoro (43)Libri (3)Linguistica computazionale (7)Linkedin (6)Linux (1)Luma AI (1)Maltrattamento infantile (1)Marina (1)Marketing (37)Medicina (23)Mercedes-Benz (1)Meta (56)Metaverso (15)Microsoft (146)Midjourney (15)Mobilità sostenibile (1)Moda (5)Modelli AI (22)Motori di Ricerca (11)Mozilla (2)Musica (32)NASA (1)Nato (2)Natura (2)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (31)Occhiali (2)Occhiali Intelligenti (1)Occhiali Smart (1)Oculistica (1)OMS (1)ONU (1)Open Source (2)OpenAI (193)Opera (8)Opera Browser (1)Oppo (3)Oracle (2)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (5)Pianeta (1)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (2)Privacy (21)Programmazione (10)Prompt (5)Pubblicazione (1)Pubblicità (18)QR Code (1)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

Il Governo dell’Intelligenza Artificiale

Gestione dei rischi e innovazione responsabileRuben Razzante Cacucci editore, pp.121 Mercoledì 18 settembre ore 11 Esperienza Europa - David Sassoli Piazza Venezia 6c, Roma...

AI Privata per Tutti: Sicurezza e Privacy su Android

Google ha annunciato un approccio rivoluzionario alla privacy e alla sicurezza su Android, presentando Gemini, il nuovo assistente AI integrato nella piattaforma. Con una...

Mi sono imparato la scienza?

Fahrenheit.iit e il potere della narrazione. Mercoledì 13 marzo, ore 17:00 in Accademia di Comunicazione e in streaming Registrati La narrazione può essere la lama...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines