Nous avons presque tous lu récemment un texte qui semblait tellement mécanique, sans âme ou artificiel qu’il nous a amenés à nous poser la question suivante : est-ce l’IA qui a écrit ça ? À mesure que les outils d’IA comme ChatGPT se généralisent, la frontière entre l’écriture humaine et celle de la machine continuera de s’estomper.
Même si vous avez le « pressentiment » qu’un texte a été généré par une IA, l’intégrité académique et/ou des décisions d’embauche pourraient être en jeu. Votre intuition selon laquelle un texte a été généré par une IA pourrait être erronée, et si tel est le cas, quelqu’un pourrait en subir les conséquences
Nous allons passer en revue quatre méthodes éprouvées permettant de déterminer si un texte donné a été rédigé par une IA. Ces quatre méthodes vont de l'analyse linguistique manuelle à l'utilisation de logiciels avancés de détection de l'IA, spécialement conçus pour les technologies actuelles en la matière.
Rechercher des phrases de longueur et de structure uniformes peut permettre de déterminer si un texte a été généré par une IA. De nombreux modèles d'IA produisent des phrases qui présentent une longueur et une structure uniformes. En revanche, la plupart des textes rédigés par des humains se caractérisent par une certaine irrégularité : un mélange de phrases courtes et percutantes et de phrases longues et complexes. Si un texte est trop uniforme, il pourrait s'agir d'une IA.
Contrairement aux auteurs humains, l'IA commet rarement des erreurs grammaticales ou des fautes de frappe. C'est pourquoi l'un des meilleurs moyens de repérer un texte rédigé par l'IA consiste à vérifier si celui-ci comporte des phrases grammaticalement irréprochables, mais s'il semble monotone ou trop formel. Cela peut indiquer que ce contenu a été généré par l'IA.
De nombreux modèles de rédaction basés sur l'IA produisent des phrases contenant bien plus de mots que nécessaire pour transmettre une information. Par exemple, ils utilisent trois mots là où un seul suffirait. Si vous lisez un texte qui regorge de mots superflus servant uniquement à remplir une phrase sans pour autant approfondir un point particulier, il se peut que ce texte ait été généré par une IA.
Vous pouvez repérer les « expressions typiques de l'IA » pour déterminer si un texte a été généré par une IA. Les grands modèles linguistiques sont formés pour être utiles et polis. En raison de cette formation, il n'est pas rare que les contenus écrits produits par ces modèles fassent un usage excessif de mots de transition spécifiques et d'adjectifs vides de sens qui apparaissent souvent dans leurs données d'entraînement.
Pour détecter un texte généré par l'IA, vous pouvez rechercher les expressions suivantes :
Si un texte contient en grande quantité l'une de ces expressions, il est possible qu'il ait été généré par une IA.
En plus d'être serviables et polis, les modèles d'IA adoptent souvent par défaut un ton neutre et excessivement diplomatique. Des expressions telles que « Il est important de noter » et « D'un autre côté » reviennent fréquemment afin d'éviter de prendre clairement position. Soyez également attentif à ces expressions. Un texte qui y recourt abondamment pourrait bien avoir été généré par une IA.
La méthode la plus fiable pour déterminer si un texte a été généré par une IA consiste à utiliser un détecteur d'IA spécialisé, tel que Pangram. Même si votre intuition peut s'avérer utile, elle reste subjective. Les outils comme Pangram, en revanche, sont objectifs.
Pangram identifie des schémas statistiques invisibles à l'œil nu. En identifiant ces schémas, Pangram est en mesure de déterminer si un contenu a été produit ou non par une IA.
Il existe de nombreux outils de détection de l'IA à votre disposition. Cependant, bon nombre d'entre eux sont peu efficaces, car ils se basent sur la « perplexité » (c'est-à-dire le degré de prévisibilité d'un texte) pour déterminer si un texte a été produit par une IA. Cela a conduit à ce que des œuvres telles que la Déclaration d'indépendance soient signalées comme ayant été générées par une IA.
Au lieu de rechercher des incohérences ou d'autres indices propres à ChatGPT, les détecteurs d'IA tels que Pangram ont recours à l'apprentissage profond pour identifier des schémas syntaxiques spécifiques. Cela leur permet de déterminer avec précision si un texte a été généré par une IA ou non.
Les meilleurs outils de détection de textes générés par l'IA affichent désormais un taux de précision de 99,98 % et un taux de faux positifs quasi nul. Pangram fait partie de ces outils. En revanche, les outils gratuits de détection de l'IA sont souvent peu fiables et sujets aux faux positifs.
On peut faire la distinction entre le « contenu assisté par l'IA » et le « contenu généré par l'IA » pour déterminer si un texte a été créé à l'aide de l'IA. En effet, la question « Est-ce que l'IA a écrit ce texte ? » n'appelle pas toujours une réponse binaire. Par exemple, une personne peut rédiger les idées principales d'un contenu, puis utiliser l'IA pour le peaufiner.
Vous pouvez utiliser des outils d'analyse avancés, tels que Pangram, pour déterminer si les idées principales d'un texte ont été rédigées par un humain puis retravaillées à l'aide de l'IA, ou si le texte a été entièrement généré par une machine.
L'écriture générée par l'IA s'inscrit dans un continuum :

Alex Roitman est responsable du développement chez Pangram Labs, une entreprise spécialisée dans la détection de contenu généré par l'IA. Son travail porte sur la manière dont les textes générés par l'IA transforment l'écriture, l'éducation et la confiance sur le Web ouvert.






