Le géant américain a récemment rendu open source SynthID-Text, un outil innovant conçu pour intégrer des filigranes imperceptibles dans le texte généré par l’intelligence artificielle. Lancé en novembre 2023, il s’inscrit dans volonté de promouvoir une IA responsable et de lutte contre la désinformation... à condition qu’il soit adopté.
Comment ça marche ?
SynthID-Text utilise des modèles de « deep learning », ce qui en fait un outil Google DeepMind, pour incorporer un filigrane numérique directement dans le processus de génération de texte.
Comment ? En ajustant subtilement les probabilités de sélection de ce que l’on appelle les « jetons » (mots, phrases, etc.) lors de la création du texte, et ce, sans altérer sa qualité, sa lisibilité ou sa créativité.
Avantage majeur : ce filigrane est conçu pour être invisible à l’œil nu, résistant (partiellement) aux modifications mineures (c’est à dire s’il y a eu un recalibrage sur le nombre de signes, un remplacement de mots, ou une légère paraphrase) et difficile à falsifier (le tout sans compromettre l’intégrité du contenu).
À terme, idéalement, ce filigrane doit permettre de :
- Lutter contre la désinformation en identifiant plus facilement le contenu généré par IA,
- Apporter plus de transparence en offrant une meilleure traçabilité du contenu en ligne,
- Apporter de la flexibilité, puisqu’il fonctionne sur divers types de textes, notamment les articles, posts de réseaux sociaux, et les-mails,
- Être complémentaire avec d’autres méthodes de détection, notamment le plagiat.
Qui sont les utilisateurs concernés ?
SynthID-Text est mis à la disposition des développeurs et des entreprises via la boîte à outils « Google Responsible Generative AI Toolkit ». On y trouve une utilisation intéressante dans plusieurs corps de métiers :
- Les créateurs de contenu IA,
- Les plateformes de publication en ligne,
- Les entreprises de médias,
- Les chercheurs en IA.

Pour l’utiliser, il « suffit » de :
- Configurer le filigrane avec des paramètres uniques et sécurisés,
- Intégrer le processeur logits SynthID dans leur pipeline de génération de texte,
- Appliquer le filigrane lors de la génération du contenu via la méthode .generate.
L’open source, la bonne nouvelle
Google a rendu SynthID-Text open source, ce qui signifie qu’il est gratuit et accessible à tous les développeurs souhaitant l’intégrer dans leurs projets.
MAIS….
Malgré son potentiel, SynthID-Text présente plusieurs limitations susceptibles de restreindre son utilisation à grande échelle (en tous cas dans sa version actuelle) :
SynthID-Text présente des limites qui ont leur importance, notamment l’absence de standardisation industrielle, car à ce jour, aucune norme commune n’existe pour les filigranes dédiés à l’IA.
Pour vérifier qu’un contenu a oui ou non été généré par IA, chaque entreprise crée sa propre méthode, avec ses propres critères, rendant difficile l’identification des contenus générés par différentes IA à plus grande échelle.
De plus, son utilisation est limitée aux parties consentantes, ne garantissant pas de protection contre les utilisateurs malveillants ni contre les modèles d’IA ouverts qui ne suivent pas les normes de filigranage.
EN GROS : Une solution de ce type ne peut donc pas assurer une protection TOTALE contre la fraude ou la manipulation de contenus par l’IA, mais cela reste un bon début pour celles et ceux qui sont à la recherche d’un système de détection sur les contenus textuels.
Comment l’intégrer dans votre entreprise ?
Evaluez les besoins
- Identifiez comment SynthID-Text peut s’intégrer dans vos opérations. Par exemple, si vous produisez des visuels ou des contenus pour les réseaux sociaux, vous pouvez étiqueter ces créations et garantir ainsi leur authenticité.
- Ayez également en tête les aspects de conformité et de sécurité qui pourraient être renforcés par l’ajout de filigranes numériques.
Créez un compte sur Google Cloud
Assurez-vous que votre compte est configuré pour utiliser Google DeepMind et les API de SynthID.
Explorez, apprenez
Il existe différents paramètres et options de SynthID, par exemple des réglages pour ajouter ce fameux SynthID-Text, mais aussi encoder des métadonnées dans vos créations visuelles.
Formez-vous, formez vos salariés
Si plusieurs personnes sont amenées à utiliser SynthID dans votre entreprise, assurez-vous qu’elles reçoivent une formation sur son fonctionnement et ses bénéfices. Il existe une grande ressource documentaire en accès libre sur la plateforme, mais si besoin, vous pouvez également faire appel à des formateurs certifiés.
Avoir un outil, oui, mais savoir s’en servir dans tout son potentiel, c’est encore mieux !
Et pour les sites externes à mon organisation ?
SynthID-Text ne permet pas d’analyser des contenus externes, notamment d’autres sites web. Vous ne pouvez donc pas l’utiliser pour savoir si votre concurrent génère des textes par IA ou si votre journal préféré l’a intégré dans sa production. Pour cela, d’autres outils existent (AI Text Classifier, GPTZero, Originality.AI, etc.)
Il est conçu pour apposer et détecter des filigranes invisibles uniquement sur des images que vous générez ou qui sont déjà marquées via SynthID.
Vous pouvez l’utiliser pour authentifier vos propres contenus visuels, mais il ne permet pas d’analyser ni de vérifier des images sur des sites externes qui n’utilisent pas ce système de marquage.

