Enseignement de l'IA

Un tour d'horizon des expressions les plus galvaudées dans le domaine de l'IA

21 février 2025

Table des matières

Partie 1 : Artefacts liés à l'IA
Partie 2 : Expressions galvaudées
3e partie : Pourquoi l'IA utilise-t-elle trop souvent les mêmes expressions ?
En prime : les n-grammes préférés de notre équipe

Comme nous l'avons évoqué la semaine dernière, l'IA a tendance à abuser de certains mots et expressions. Vous en connaissez sans doute quelques-uns d'emblée : de « a testament to » à « delve ». La présence fréquente de ces expressions peut être un indicateur fiable que le texte que vous avez sous les yeux a été généré par l'IA, mais elles sont bien trop nombreuses pour qu'une seule personne puisse toutes les repérer.

Pour résoudre ce problème, nous avons récemment mis en place un outil appelé « Expressions IA », qui met spécifiquement en évidence ces expressions. Dans le cadre du développement de cet outil, nous avons constitué un vaste ensemble de données regroupant les expressions les plus couramment utilisées en matière d'IA. Dans cet article, nous vous présenterons certaines des expressions les plus courantes qui figurent dans notre ensemble de données et nous vous expliquerons comment vous pouvez les utiliser pour affiner votre intuition concernant les textes générés par l'IA.

Partie 1 : Artefacts liés à l'IA

Commençons par le plus évident : il arrive parfois qu’une IA vous dise carrément qu’elle est une IA ! Cela se produit souvent à la suite d’un refus. Lorsqu’un utilisateur demande à une IA de faire quelque chose qu’elle a reçu l’ordre de ne pas faire, elle doit lui indiquer qu’elle ne peut pas accéder à sa demande, et dans ce contexte, le modèle reconnaîtra souvent qu’il s’agit d’une IA. De nombreux refus d'IA commencent par la phrase « En tant que modèle linguistique d'IA… ». Il s'ensuit que ce type de phrase serait assez courant dans les textes générés par l'IA et extrêmement rare dans les textes humains. Les chiffres le confirment ! Bon nombre de nos expressions d'IA les plus courantes sont autoréférentielles.

Phrase	Plus fréquent
En tant que modèle linguistique basé sur l'IA,	294,000x
Je n'ai pas de	67,000x
Malheureusement, je n'ai pas assez	54,000x
modèle linguistique, je ne peux pas	53,000x

Partie 2 : Expressions galvaudées

Les « artefacts IA » font partie des expressions les plus galvaudées dans le domaine de l'IA, mais elles sont en fin de compte assez évidentes et donc peu intéressantes. Passons maintenant à la partie intéressante : les expressions qui sont certes surreprésentées dans les textes sur l'IA, mais qui n'ont rien à voir avec le fait d'« être une IA ». En voici quelques-unes :

Phrase	Plus fréquent
comme un poignant	49,000x
Comme un puissant rappel	43,000x
rappel de la pérennité	31,000x
a dû relever de nombreux défis	30,000x
Nos résultats apportent un éclairage nouveau sur	22,000x
dans l'interaction complexe	21,000x
sert de puissant	10,000x
fournissant des informations précieuses sur	5,000x
sert de témoignage	4,000x
nouveau sens à donner à sa vie	4,000x
même face à l'inimaginable	3,000x
rappel du potentiel	3,000x

3e partie : Pourquoi l'IA utilise-t-elle trop souvent les mêmes expressions ?

On comprend aisément pourquoi une IA qui dit « En tant qu'IA... » soit beaucoup plus courante dans les textes générés par l'IA. Mais qu'est-ce qui explique que les phrases apparemment sans rapport de la partie 2 soient plus fréquentes ? Tout d'abord, il existe un phénomène appelé « effondrement de mode », dans lequel les résultats générés par l'IA deviennent trop génériques ou répétitifs en s'appuyant sur des séquences de mots à forte probabilité. L'effondrement de mode...

De plus, une fois l'entraînement terminé, il est courant de recourir au RLHF (Reinforcement Learning from Human Feedback, ou apprentissage par renforcement à partir du retour d'information humain). Au cours de ce processus, des annotateurs humains évaluent les textes générés par l'IA en fonction d'un certain nombre de critères, afin d'encourager certaines tendances et d'en décourager d'autres. Tout au long de ce processus, si certaines réponses ou expressions sont susceptibles d'être récompensées par ces annotateurs humains, elles deviendront de plus en plus fréquentes.

Par conséquent, certaines de ces expressions galvaudées peuvent être considérées comme une caractéristique propre à certains modèles, architectures et processus d'entraînement, plutôt que comme de simples traits distinctifs de l'écriture générée par l'IA en soi. Un article rédigé par Jenna Russell, Marzena Karpinska et Mohit Iyyer, de l'université du Maryland, montre que différents modèles ont en réalité des expressions de prédilection différentes :

surutilisé

surutilisé

Cela suggère que différents modèles, entraînés à partir d'ensembles de données et de stratégies d'optimisation variés, peuvent développer leurs propres tendances en matière de répétition de phrases.

En prime : les n-grammes préférés de notre équipe

Dans le cadre de notre travail, notre équipe a passé un nombre incalculable d'heures à lire et à analyser des textes générés par l'IA. Naturellement, nous avons développé une certaine affinité pour certaines de ces expressions :

Voici les expressions générées par l'IA préférées de notre équipe :

Max (PDG) : « Dans ce monde en constante évolution » (11 000 fois)
Bradley (directeur technique) : « À noter » (3 000 fois)
Lu (ingénieur fondateur) : « nature complexe » (6 000 fois)
Elyas (ingénieur fondateur) : « une mosaïque haute en couleur » (17 000 fois)

Elyas MasrourIngénieur fondateur

Elyas Masrour est ingénieur fondateur chez Pangram. Depuis qu’il a rejoint Pangram en tant que deuxième employé, tout juste sorti de l’université du Maryland, il a mis en place des infrastructures essentielles telles que l’API de service des modèles, les contrôles d’accès basés sur les rôles et les pipelines de données justificatives. Elyas travaille également en étroite collaboration avec l’équipe de recherche sur des projets tels que la robustesse face aux attaques adversaires, l’interprétabilité des modèles et la détection de contenus mixtes hétérogènes. En dehors du travail, Elyas apprécie toute la diversité de la créativité et de l'expression humaines, notamment le cinéma, la lecture et la découverte de la ville.

Plus d'articles d'Elyas Masrour

Lectures complémentaires

Google va-t-il pénaliser les contenus générés par l'IA en 2026 ?

Enseignement de l'IA

Google va-t-il pénaliser les contenus générés par l'IA en 2026 ?

Google pénalise-t-il le contenu généré par l'IA ? Certains pensent que Google est toujours à l'affût de ce type de contenu et que, toutes choses égales par ailleurs, il le classe moins bien. Mais la réalité est plus nuancée.

Alex Roitman30 janvier 2026

L'état de l'intégrité académique et de la détection par IA en 2025

Enseignement de l'IA

L'état de l'intégrité académique et de la détection par IA en 2025

Bradley Emi, directeur technique de Pangram Labs, a animé une session sur l'état des lieux de la détection de l'IA lors de la conférence de l'ICAI.

Destiny Akinode4 décembre 2025

Comment repérer un texte rédigé par une IA

Enseignement de l'IA

Comment repérer un texte rédigé par une IA

ChatGPT et d'autres grands modèles linguistiques (LLM), souvent désignés collectivement sous le terme « IA », sont devenus des outils de plus en plus populaires.

Max Spero17 juin 2024

Tout ce qu'il faut savoir sur les faux positifs dans les détecteurs basés sur l'IA

Enseignement de l'IA

Tout ce qu'il faut savoir sur les faux positifs dans les détecteurs basés sur l'IA

Une analyse approfondie de la manière dont Pangram parvient à atteindre des taux de faux positifs parmi les meilleurs du secteur en matière de détection par IA, avec un taux de faux positifs de 1 pour 10 000.

Bradley Emi27 mars 2025

Outils de détection par IA pour les enseignants : pourquoi les établissements scolaires ont besoin d'outils de détection par IA

Enseignement de l'IA

Outils de détection par IA pour les enseignants : pourquoi les établissements scolaires ont besoin d'outils de détection par IA

Je rencontre beaucoup d'enseignants qui partagent ce point de vue concernant la vérification des travaux écrits des élèves à l'aide de l'IA. J'entends souvent : « Je connais bien les écrits de mes élèves, je n'ai donc pas besoin d'un logiciel de détection par IA. »

Jason Nicholson4 février 2025

Quel détecteur d'IA les universités devraient-elles utiliser ? La norme académique de 2026

Enseignement de l'IA

Quel détecteur d'IA les universités devraient-elles utiliser ? La norme académique de 2026

Le monde universitaire est confronté à une explosion de l'utilisation de l'IA générative. Les universités ont dû revoir en urgence leurs politiques en matière d'intégrité académique.

Alex Roitman11 mai 2026

Abonnez-vous à nos actualités sur

Restez informé grâce à nos dernières actualités et offres.

soc2

SOC2 TYPE 2

Vérifié par AssuranceLab

© 2025 Pangram. Tous droits réservés.

info@pangram.com

Rejoignez notre communauté

© 2025 Pangram. Tous droits réservés.