AI e storia: quanto sanno davvero i modelli linguistici avanzati?

I modelli linguistici di grandi dimensioni (LLMs) stanno trasformando la ricerca nelle scienze umane e sociali, ma la loro comprensione della storia a livello accademico è ancora poco esplorata. Uno studio recente ha affrontato questa lacuna introducendo il History Seshat Test for LLMs (Hist-LLM), basato sul Seshat Global History Databank, un vasto archivio che racchiude 36.000 dati su 600 società storiche, dalla preistoria alla Rivoluzione Industriale.

Il test ha valutato sette modelli delle famiglie GeminiOpenAI e Llama, misurandone le capacità su una varietà di argomenti storici globali. I risultati mostrano che gli LLM superano il livello del caso (25%) con una precisione bilanciata che varia dal 33,6% (Llama-3.1-8B) al 46% (GPT-4-Turbo). Tuttavia, restano lontani dal livello di competenza di esperti umani.

Interessante notare che i modelli mostrano una maggiore accuratezza sulle epoche più antiche, con performance regionali relativamente equilibrate. Tuttavia, le zone meno rappresentate nei database storici, come l’Oceania e l’Africa subsahariana, registrano i punteggi più bassi anche nei modelli più avanzati.

Lo studio evidenzia sia le potenzialità che i limiti degli LLM nella comprensione storica. Nonostante una conoscenza che si avvicina a quella esperta in alcuni ambiti, rimangono ampi margini di miglioramento, soprattutto nella gestione delle lacune informative e nell’equilibrio tra le regioni storiche.

Questo lavoro rappresenta un passo avanti verso lo sviluppo di modelli più affidabili per la ricerca storica, sottolineando l’importanza di dataset diversificati e di qualità per migliorare le capacità dei modelli di intelligenza artificiale.

NEWS AIopenmind su:

#newsChatAIopenmind (1)3D (8)6G (2)Accademia di Comunicazione (4)Acer (1)Adobe (41)Aeronautica (10)Africa (3)Agenti AI (7)Agenti autonomi (1)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (11)AGID (1)Agricoltura (2)Amazon (43)Ambiente (4)AMD (2)Android (6)Animali (6)Animazione (5)Anthropic (28)Anziani (1)App (12)Apple (71)Archeologia (3)Architettura (4)Archivi storici (1)Armi (4)Arredamento interni (2)Arte (30)Assistente vocale (6)Astronomia (2)Asus (2)AT&T (1)Audi (1)Audio (58)Autoapprendimento (1)Avatar (7)Aviazione (1)Avvocati (2)Aziende (20)Banca (4)Bard (3)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)Canva (7)Cattolicesimo (3)Certificazioni (1)Cesintes (1)chataudio (1)Chatbot IA (53)Chip (3)Cina (74)Cinema (11)Claude (20)Clima (5)CNR (1)Coca-Cola (1)Commercio (2)Commissione Europea (2)Compagnie aeree (1)Computer (5)Computer quantistici (37)Computer Vision (3)Comuni italiani (1)Comunicazione (10)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (1)Contabilità (2)Convegno (13)Copilot (6)Copyright (17)Criptovalute (1)Cybersecurity (4)Dalle-2 (3)Dark web (3)Data center (11)Dating (1)Deepfake (3)Design automobilistico (2)Design Industriale (6)Diritti Autore (1)Disney (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)eBay (1)Editing fotografico (3)Editoria (13)Email (1)ENEA (2)Esercito (2)Et (0)Etica (152)Europol (2)Eventi (7)Evento (8)Facebook (4)FakeNews (18)Falegnameria (1)Fauna selvatica (1)Film (6)Finanza (12)Finanziamenti Italia (4)Firefly (3)Firefox (1)Fondo Monetario Internazionale (1)Formazione (26)Fotografia (113)Francia (1)Free lance (1)G7 (1)Gaming (1)Garante privacy (21)Giappone (10)Giochi (10)Giornalismo (21)Giustizia (2)Google (359)Governo (7)Governo Italiano (3)Grafica (6)Guerra (14)Guida autonoma (7)Hong Kong (2)Hugging Face (5)IBM (8)Illustrazioni (1)iMessage (1)Immobiliare (1)India (5)Indossabili (4)Influencer (1)Informazione (10)Inghilterra (10)INPS (2)Intel (8)ISO (1)Istruzione (17)Jailbreaking (1)Kamala Harris (1)Lavoro (59)Libri (3)Linguistica computazionale (10)Linkedin (9)Linux (1)Luma AI (1)Maltrattamento infantile (1)Marina (1)Marketing (100)Medicina (36)Mercedes-Benz (1)Meta (110)Metaverso (17)Meteo (1)Microsoft (210)Midjourney (18)Mobilità sostenibile (2)Moda (6)Modelli AI (85)Motori di Ricerca (13)Mozilla (2)Museo (1)Musica (40)NASA (1)Nato (2)Natura (2)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (50)Occhiali (7)Occhiali Intelligenti (2)Occhiali Smart (1)Oculistica (1)Odore (1)OMS (1)ONU (1)Open Source (4)OpenAI (308)Opera (14)Opera Browser (1)Oppo (3)Oracle (3)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (13)Pianeta (2)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (4)Privacy (30)Programmazione (12)Prompt (5)Pubblicazione (1)Pubblicità (19)QR Code (1)Qualcomm (4)Ray-Ban (7)Realtà mista (4)Reddit (7)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (127)Ricerca scientifica (9)Riconoscimento emotivo (1)Risorse online (100)Ristorazione (3)Robotica (51)Runway (13)Salute (7)Samsung (14)Sanità (18)Satelliti (2)Sceneggiatura (1)Semiconduttori (2)SEO (3)Shopping online (4)Sicurezza (27)Sicurezza informatica (78)SMS (1)Snapchat (8)Soccorso (1)Società (12)Software (4)Sport (3)Spotify (5)Stability (4)Stable Animation SDK (1)Stable Diffusion (12)Stampanti (1)Standard (4)Startup (362)streaming live (1)Supercomputer (4)Superintelligenza (3)Sviluppatori (1)Sviluppo sostenibile (1)Synthesia (1)Taiwan (3)Taxi (2)Telecomunicazioni (4)Telegram (3)Televisione (1)Tesla (9)TikTok (11)Torah (1)Traduttore AI (7)Truffa (2)Twitter (13)Ucraina (3)Udito (1)UE (13)UNESCO (2)UNICEF (1)Unione Europea (26)Università (5)Uomo (1)USA (58)Vaticano (4)Video (125)Videocomunicazione (4)Videogiochi (4)Vigili del fuoco (1)Violenza domestica (1)Visualizzazione dati (1)Vodafone (1)Vogue Business - As Gen Z matures (0)Volkswagen (1)VPN (3)Website (12)WhatsApp (11)Wikipedia (1)Wordpress (3)X (12)Xiaomi (1)Yahoo (3)Youtube (17)Zoom (6)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

Meta svela il Framework AI Frontier: un passo avanti verso un’IA responsabile

Meta ha recentemente presentato il suo "Framework AI Frontier", delineando una strategia per lo sviluppo e la distribuzione responsabile di modelli di intelligenza artificiale...

Willow: il chip quantistico di Google che sfida l’eternità

https://www.youtube.com/watch?v=h6w4SX7ZJMQ Google ha annunciato il lancio di Willow, un chip quantistico di ultima generazione che rappresenta un significativo progresso nel campo della computazione quantistica. Con...

Dati strutturati, decisioni intelligenti: la rivoluzione di Neuralk-AI

Neuralk-AI, startup francese fondata nel 2023 da Antoine Moissenot e Alexandre Pasquiou, sta rivoluzionando l'analisi dei dati strutturati attraverso modelli di intelligenza artificiale avanzati....

Mi sono imparato la scienza?

Fahrenheit.iit e il potere della narrazione. Mercoledì 13 marzo, ore 17:00 in Accademia di Comunicazione e in streaming Registrati La narrazione può essere la lama...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines