L’azienda Sesame sta sviluppando un assistente vocale capace di comprendere emozioni e contesto, migliorando la collaborazione tra uomo e macchina. Il loro obiettivo è creare compagni digitali in grado di interagire naturalmente con gli utenti.
Tecnologia avanzata per un’interazione naturale
Sesame introduce il Conversational Speech Model (CSM), una tecnologia basata su trasformatori multimodali che consente all’assistente vocale di adattarsi al tono, ritmo e contesto della conversazione. A differenza delle attuali sintesi vocali, CSM utilizza un sistema avanzato di token acustici e semantici per generare risposte più naturali e realistiche.
Occhiali intelligenti e assistente personale
Il progetto prevede anche occhiali leggeri con audio integrato, progettati per un utilizzo quotidiano, offrendo un accesso immediato all’assistente vocale. Questo dispositivo potrebbe rivoluzionare il modo in cui interagiamo con la tecnologia, rendendola più intuitiva e discreta.
Open source e sviluppi futuri
Sesame ha annunciato l’intenzione di rendere open source parti del suo lavoro, favorendo la collaborazione della comunità scientifica. Tra i futuri obiettivi, l’azienda punta a migliorare il supporto multilingua e affinare l’intelligenza emotiva dell’assistente per conversazioni ancora più realistiche.
Fonti
- Sesame AI: sesame.com
- Studio su Conversational Speech Model (CSM): arXiv.org