#newsTECNĒaiopenmind

Qwen2-VL: L’Intelligenza Artificiale Che Vede Oltre i Limiti

Settembre 20, 2024

Dopo un anno di intensi sforzi, è stato presentato Qwen2-VL, l’ultima evoluzione dei modelli di linguaggio visivo della famiglia Qwen. Rispetto al suo predecessore, Qwen-VL, questa nuova versione porta con sé capacità rivoluzionarie nella comprensione visiva e nel ragionamento complesso.

Qwen2-VL eccelle nella comprensione di immagini di diverse risoluzioni e proporzioni, raggiungendo prestazioni all’avanguardia in benchmark visivi come MathVista e DocVQA. Inoltre, il modello è in grado di analizzare video di oltre 20 minuti, rendendolo uno strumento efficace per la creazione di contenuti basati su video e per rispondere a domande complesse.

Una delle caratteristiche più innovative di Qwen2-VL è la sua integrazione con dispositivi come smartphone e robot, permettendo operazioni automatiche basate sull’ambiente visivo e su istruzioni testuali. La sua capacità di ragionamento avanzato e decision making lo rende un potente alleato nella gestione di dispositivi.

Qwen2-VL supporta, inoltre, la comprensione di testi multilingue, offrendo un’esperienza d’uso globale. Oltre all’inglese e al cinese, il modello ora riconosce testi in lingue europee, giapponese, coreano, arabo e vietnamita, tra gli altri.

La release include le versioni open-source Qwen2-VL-2B e Qwen2-VL-7B sotto licenza Apache 2.0, integrate con piattaforme come Hugging Face e vLLM, mentre l’API per il modello Qwen2-VL-72B è stata resa disponibile. Con prestazioni eccezionali su vari fronti, Qwen2-VL rappresenta un balzo in avanti per l’intelligenza artificiale visiva.

Articolo precedente

Gemini: 5 modi per studiare in modo più intelligente

Prossimo articolo

Amazon scommette su Claude: l’IA generativa per un Alexa più potente e veloce

NEWS AIopenmind su:

3D (5)6G (1)Accademia di Comunicazione (4)Acer (1)Adobe (32)Aeronautica (9)Africa (2)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (4)AGID (1)Amazon (26)Ambiente (1)AMD (1)Android (6)Animali (6)Animazione (4)Anthropic (5)Anziani (1)App (10)Apple (52)Archeologia (3)Architettura (4)Armi (3)Arredamento interni (2)Arte (27)Assistente vocale (3)Astronomia (2)Asus (1)AT&T (1)Audi (1)Audio (51)Autoapprendimento (1)Avatar (3)Aviazione (1)Avvocati (2)Aziende (18)Banca (3)Bard (3)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)Canva (5)Cattolicesimo (3)Certificazioni (1)Cesintes (1)chataudio (1)Chatbot IA (41)Chip (3)Cina (52)Cinema (4)Claude (17)Clima (3)CNR (1)Coca-Cola (1)Commercio (2)Commissione Europea (1)Compagnie aeree (1)Computer (3)Computer quantistici (30)Computer Vision (3)Comuni italiani (1)Comunicazione (9)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (1)Contabilità (1)Convegno (13)Copilot (5)Copyright (12)Criptovalute (1)Cybersecurity (1)Dalle-2 (3)Dark web (2)Data center (1)Dating (1)Deepfake (2)Design automobilistico (2)Design Industriale (6)Diritti Autore (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)eBay (1)Editing fotografico (2)Editoria (9)Email (1)ENEA (2)Esercito (2)Etica (120)Europol (1)Eventi (5)Evento (7)Facebook (4)FakeNews (18)Falegnameria (1)Fauna selvatica (1)Film (2)Finanza (7)Finanziamenti Italia (3)Firefly (3)Firefox (1)Fondo Monetario Internazionale (1)Formazione (12)Fotografia (97)Francia (1)Free lance (1)G7 (1)Gaming (1)Garante privacy (19)Giappone (9)Giochi (7)Giornalismo (10)Giustizia (1)Google (240)Governo (7)Governo Italiano (2)Grafica (5)Guerra (12)Guida autonoma (3)Hong Kong (1)Hugging Face (3)IBM (6)Illustrazioni (1)iMessage (1)Immobiliare (1)India (3)Indossabili (2)Influencer (1)Informazione (9)Inghilterra (6)INPS (2)Intel (6)ISO (1)Istruzione (16)Jailbreaking (1)Kamala Harris (1)Lavoro (43)Libri (3)Linguistica computazionale (7)Linkedin (6)Linux (1)Luma AI (1)Maltrattamento infantile (1)Marina (1)Marketing (37)Medicina (24)Mercedes-Benz (1)Meta (57)Metaverso (15)Microsoft (153)Midjourney (16)Mobilità sostenibile (1)Moda (5)Modelli AI (26)Motori di Ricerca (11)Mozilla (2)Musica (32)NASA (1)Nato (2)Natura (2)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (31)Occhiali (2)Occhiali Intelligenti (1)Occhiali Smart (1)Oculistica (1)OMS (1)ONU (1)Open Source (2)OpenAI (198)Opera (9)Opera Browser (1)Oppo (3)Oracle (2)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (5)Pianeta (1)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (2)Privacy (21)Programmazione (10)Prompt (5)Pubblicazione (1)

AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

CALL FOR INTELLIGENCE

#news ETHOS AIopenmind

#news NISQ AIopenmind

#news TECNĒ AIopenmind

I Think/eventi

Iscrizione NEWSLETTER

Link utili