#newsTECNĒ-AIopenmind

AI e storia: quanto sanno davvero i modelli linguistici avanzati?

Gennaio 20, 2025

I modelli linguistici di grandi dimensioni (LLMs) stanno trasformando la ricerca nelle scienze umane e sociali, ma la loro comprensione della storia a livello accademico è ancora poco esplorata. Uno studio recente ha affrontato questa lacuna introducendo il History Seshat Test for LLMs (Hist-LLM), basato sul Seshat Global History Databank, un vasto archivio che racchiude 36.000 dati su 600 società storiche, dalla preistoria alla Rivoluzione Industriale.

Il test ha valutato sette modelli delle famiglie Gemini, OpenAI e Llama, misurandone le capacità su una varietà di argomenti storici globali. I risultati mostrano che gli LLM superano il livello del caso (25%) con una precisione bilanciata che varia dal 33,6% (Llama-3.1-8B) al 46% (GPT-4-Turbo). Tuttavia, restano lontani dal livello di competenza di esperti umani.

Interessante notare che i modelli mostrano una maggiore accuratezza sulle epoche più antiche, con performance regionali relativamente equilibrate. Tuttavia, le zone meno rappresentate nei database storici, come l’Oceania e l’Africa subsahariana, registrano i punteggi più bassi anche nei modelli più avanzati.

Lo studio evidenzia sia le potenzialità che i limiti degli LLM nella comprensione storica. Nonostante una conoscenza che si avvicina a quella esperta in alcuni ambiti, rimangono ampi margini di miglioramento, soprattutto nella gestione delle lacune informative e nell’equilibrio tra le regioni storiche.

Questo lavoro rappresenta un passo avanti verso lo sviluppo di modelli più affidabili per la ricerca storica, sottolineando l’importanza di dataset diversificati e di qualità per migliorare le capacità dei modelli di intelligenza artificiale.

News ➤
Report

Articolo precedente

Dibattito sulle armi autonome: il futuro della guerra in mano all’IA?

Prossimo articolo

L’AI si “innervosisce”: NotebookLM regola il tono degli host virtuali

NEWS AIopenmind su:

#newsChatAIopenmind (1)3D (8)6G (2)Accademia di Comunicazione (4)Acer (1)Adobe (41)Aeronautica (10)Africa (3)Agenti AI (7)Agenti autonomi (1)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (11)AGID (1)Agricoltura (2)Amazon (43)Ambiente (4)AMD (2)Android (6)Animali (6)Animazione (5)Anthropic (28)Anziani (1)App (12)Apple (71)Archeologia (3)Architettura (4)Archivi storici (1)Armi (4)Arredamento interni (2)Arte (30)Assistente vocale (6)Astronomia (2)Asus (2)AT&T (1)Audi (1)Audio (58)Autoapprendimento (1)Avatar (7)Aviazione (1)Avvocati (2)Aziende (20)Banca (4)Bard (3)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)Canva (7)Cattolicesimo (3)Certificazioni (1)Cesintes (1)chataudio (1)Chatbot IA (53)Chip (3)Cina (74)Cinema (11)Claude (20)Clima (5)CNR (1)Coca-Cola (1)Commercio (2)Commissione Europea (2)Compagnie aeree (1)Computer (5)Computer quantistici (37)Computer Vision (3)Comuni italiani (1)Comunicazione (10)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (1)Contabilità (2)Convegno (13)Copilot (6)Copyright (17)Criptovalute (1)Cybersecurity (4)Dalle-2 (3)Dark web (3)Data center (11)Dating (1)Deepfake (3)Design automobilistico (2)Design Industriale (6)Diritti Autore (1)Disney (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)eBay (1)Editing fotografico (3)Editoria (13)Email (1)ENEA (2)Esercito (2)Et (0)Etica (152)Europol (2)Eventi (7)Evento (8)Facebook (4)FakeNews (18)Falegnameria (1)Fauna selvatica (1)Film (6)Finanza (12)Finanziamenti Italia (4)Firefly (3)Firefox (1)Fondo Monetario Internazionale (1)Formazione (26)Fotografia (113)Francia (1)Free lance (1)G7 (1)Gaming (1)Garante privacy (21)Giappone (10)Giochi (10)Giornalismo (21)Giustizia (2)Google (359)Governo (7)Governo Italiano (3)Grafica (6)Guerra (14)Guida autonoma (7)Hong Kong (2)Hugging Face (5)IBM (8)Illustrazioni (1)iMessage (1)Immobiliare (1)India (5)Indossabili (4)Influencer (1)Informazione (10)Inghilterra (10)INPS (2)Intel (8)ISO (1)Istruzione (17)Jailbreaking (1)Kamala Harris (1)Lavoro (59)Libri (3)Linguistica computazionale (10)Linkedin (9)Linux (1)Luma AI (1)Maltrattamento infantile (1)Marina (1)Marketing (100)Medicina (36)Mercedes-Benz (1)Meta (110)Metaverso (17)Meteo (1)Microsoft (210)Midjourney (18)Mobilità sostenibile (2)Moda (6)Modelli AI (85)Motori di Ricerca (13)Mozilla (2)Museo (1)Musica (40)NASA (1)Nato (2)Natura (2)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (50)Occhiali (7)Occhiali Intelligenti (2)Occhiali Smart (1)Oculistica (1)Odore (1)OMS (1)ONU (1)Open Source (4)OpenAI (308)Opera (14)Opera Browser (1)Oppo (3)Oracle (3)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (13)Pianeta (2)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (4)Privacy (30)Programmazione (12)Prompt (5)Pubblicazione (1)Pubblicità (19)QR Code (1)Qualcomm (4)Ray-Ban (7)Realtà mista (4)Reddit (7)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (127)Ricerca scientifica (9)Riconoscimento emotivo (1)Risorse online (100)Ristorazione (3)Robotica (51)Runway (13)Salute (7)Samsung (14)Sanità (18)Satelliti (2)Sceneggiatura (1)Semiconduttori (2)SEO (3)Shopping online (4)Sicurezza (27)Sicurezza informatica (78)SMS (1)Snapchat (8)Soccorso (1)Società (12)Software (4)Sport (3)Spotify (5)Stability (4)Stable Animation SDK (1)Stable Diffusion (12)Stampanti (1)Standard (4)Startup (362)streaming live (1)Supercomputer (4)Superintelligenza (3)Sviluppatori (1)Sviluppo sostenibile (1)Synthesia (1)Taiwan (3)Taxi (2)Telecomunicazioni (4)Telegram (3)Televisione (1)Tesla (9)TikTok (11)Torah (1)Traduttore AI (7)Truffa (2)Twitter (13)Ucraina (3)Udito (1)UE (13)UNESCO (2)UNICEF (1)Unione Europea (26)Università (5)Uomo (1)USA (58)Vaticano (4)Video (125)Videocomunicazione (4)Videogiochi (4)Vigili del fuoco (1)Violenza domestica (1)Visualizzazione dati (1)Vodafone (1)Vogue Business - As Gen Z matures (0)Volkswagen (1)VPN (3)Website (12)WhatsApp (11)Wikipedia (1)Wordpress (3)X (12)Xiaomi (1)Yahoo (3)Youtube (17)Zoom (6)

AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

CALL FOR INTELLIGENCE

#news ETHOS AIopenmind

#news NISQ AIopenmind

#news TECNĒ AIopenmind

I Think/eventi

Iscrizione NEWSLETTER

Link utili