Google DeepMind e Hugging Face hanno lanciato SynthID Text, una nuova tecnologia che consente di identificare i contenuti generati dall’intelligenza artificiale. Rilasciata nella versione 4.46.0 di Transformers, questa funzione permette di applicare una filigrana ai testi prodotti dall’intelligenza artificiale, utilizzando un processo basato sui logit, per segnalare in modo invisibile ma rilevabile che il testo è frutto di un modello AI. Lo scopo è garantire maggiore trasparenza nell’informazione digitale, contribuendo a combattere la disinformazione e l’attribuzione errata.
La tecnica di SynthID Text non altera il funzionamento dei modelli né compromette la qualità del testo generato, grazie all’uso di una funzione pseudo-casuale (g-function) che integra una filigrana impercettibile, visibile solo da un modello addestrato. Il watermark viene configurato con parametri specifici, tra cui una lista di numeri interi (keys) e un parametro di lunghezza (ngram_len), che equilibrano qualità e rilevabilità. Questa configurazione, definita in modo personalizzato per ogni modello, viene poi applicata al testo generato tramite l’API model.generate().
La rilevazione della filigrana avviene tramite un classificatore addestrato, in grado di distinguere tra testi con e senza filigrana. La tecnologia prevede anche l’uso di un rilevatore bayesiano per riconoscere i contenuti filigranati, garantendo una difesa efficace contro le manipolazioni di testo.
Sebbene SynthID Text mostri alcune limitazioni, come la vulnerabilità a riscritture significative o traduzioni, resta una delle soluzioni più promettenti per garantire una maggiore sicurezza e responsabilità nell’uso dei contenuti generati da AI.