Annonce d'un nouveau partenariat avec Proofig ! En savoir plus

Présentation des phrases IA de Pangram

Élias Masrour
14 février 2025

Si vous y prêtez suffisamment attention, vous pouvez souvent trouver dans un texte des indices qui suggèrent qu'il a été rédigé par une IA. Certaines structures de phrases, certains choix de mots ou certaines mises en forme apparaissent beaucoup plus souvent dans les textes rédigés par une IA que dans ceux rédigés par des humains.

Vous connaissez peut-être déjà quelques expressions qui semblent indiquer qu'un texte a été généré par une IA. Les exemples sont nombreux : « tapisserie complexe », « témoignage de », ou même le mot « delve » (explorer), largement popularisé par l'écrivain et investisseur Paul Graham.

Tweet de Paul Graham

Si vous utilisez régulièrement le tableau de bord Pangram, vous avez peut-être remarqué que nous avons commencé à mettre en évidence les expressions trop utilisées par l'IA, comme « tapisserie complexe » dans l'essai ci-dessous.

Voici le nouvel outil AI Phrases de Pangram ! Voici comment il fonctionne :

Lorsque vous scannez un document et que Pangram détecte qu'il a été généré par une IA, nous effectuons un deuxième scan à la recherche d'expressions courantes utilisées par les IA.

Pour entraîner notre modèle à être très précis, nous utilisons des ensembles de données internes comprenant des dizaines de millions de documents générés par des humains et par l'IA. Par ailleurs, notre équipe peut analyser ces deux ensembles de données à la recherche de séquences de mots courantes dans les écrits humains et ceux générés par l'IA. Nous pouvons ensuite comparer les statistiques pour voir si l'IA utilise réellement certaines expressions de manière excessive. Nous utilisons une technique appelée analyse N-Gram (la similitude avec PaNGram n'est peut-être pas une coïncidence 😊), et les résultats sont frappants. Nous constatons clairement qu'il existe d'innombrables expressions que l'IA semble utiliser beaucoup plus souvent que les humains. Elles sont si nombreuses, en fait, que nous avons décidé de créer un outil permettant d'afficher ces expressions directement sur le tableau de bord Pangram.

Pourquoi est-ce important ?

Chez Pangram, nous nous intéressons à la préservation des voix humaines. Nous disposons d'un modèle de détection central capable de traiter des centaines de milliers de détails concernant un texte afin de déterminer s'il a été généré par une IA ou non.

Cependant, nous nous intéressons également à l'explicabilité. Savoir qu'une expression particulière est fortement surreprésentée dans un texte généré par l'IA peut vous permettre de mieux comprendre (et d'expliquer aux autres !) pourquoi nous avons détecté ou non un texte comme étant généré par l'IA. Si vous savez qu'un texte contient plusieurs expressions qui apparaissent des centaines ou des milliers de fois plus fréquemment dans les textes générés par l'IA que dans les textes rédigés par des humains, vous disposez désormais de preuves plus quantifiables pour étayer notre jugement.

Nous voulons vous tenir informés, vous, nos utilisateurs, non seulement sur le fait qu'un texte est généré par l'IA, mais aussi sur la manière dont nous pouvons le déterminer. Les phrases générées par l'IA constituent un élément clé de cette mission et de notre démarche globale vers l'interprétabilité.

Dans nos prochains articles, nous passerons en revue certaines des expressions les plus utilisées dans le domaine de l'IA, alors restez à l'écoute ! Pour plus d'informations sur Pangram ou nos fonctionnalités d'interprétabilité, n'hésitez pas à nous contacter à l'adresse info@pangram.com.

Abonnez-vous à notre newsletter
Nous partageons chaque mois les dernières avancées de nos recherches en matière de détection de l'IA.