La tricherie se résume rarement à un simple copier-coller d'un article entier de Wikipédia par un étudiant. Les étudiants ont recours à des méthodes plus sophistiquées pour dissimuler leurs travaux non originaux.
L'essor des grands modèles linguistiques, tels que ChatGPT, a donné un coup d'accélérateur à une forme de malhonnêteté académique connue sous le nom de « plagiat par assemblage ». Lorsqu'il est réalisé à l'aide de l'IA, le plagiat par assemblage sème la confusion dans les outils d'évaluation classiques et complique la tâche des enseignants qui souhaitent évaluer correctement le travail de leurs élèves.
Ce guide définit le « plagiat par assemblage », explique en quoi l'IA a compliqué ce type de plagiat et montre comment les enseignants peuvent utiliser conjointement l'IA et les logiciels de détection de plagiat pour démêler la paternité de documents complexes.
Le plagiat par assemblage consiste à assembler différentes phrases, idées et passages provenant de multiples sources – souvent en les reformulant légèrement ou en remplaçant certains mots par des synonymes – puis à les présenter comme une œuvre nouvelle et originale sans aucune forme de citation appropriée.

Détection du plagiat par IA
Un plagiat par « patchwork » involontaire peut survenir en raison d'une prise de notes insuffisante ou du fait de ne pas citer la source de certaines affirmations. Cependant, le plus souvent, le plagiat par « patchwork » est utilisé intentionnellement, afin de contourner les logiciels anti-plagiat traditionnels qui recherchent de longs blocs de texte copiés d'un seul tenant.
Les documents universitaires issus d'un plagiat par assemblage ressemblent souvent à des « documents à la Frankenstein ». Ils présentent fréquemment des variations de ton et de vocabulaire qui nuisent à la fluidité du texte. Parfois, ils manquent de cohérence sur le plan structurel, même si le texte en lui-même est parfaitement compréhensible. Le plagiat par assemblage est parfois appelé « plagiat hybride ».
L'IA générative a modernisé le plagiat par assemblage en permettant aux étudiants de faire deux choses : assembler instantanément des sources rédigées par des humains avec des paragraphes générés par l'IA et/ou paraphraser de longs passages de texte volés de manière à ce que le texte semble original.
Les grands modèles linguistiques (LLM) auxquels les gens font confiance sont entraînés à partir d'énormes ensembles de données et, de ce fait, ils peuvent parfois reproduire des contenus protégés par le droit d'auteur, des formulations ou une copie directe du travail d'autrui. Lorsqu'un étudiant rend un travail généré par l'IA, il est possible qu'il remette en réalité un travail humain plagié.

Détecteur de plagiat basé sur l'IA de Pangram
Pour se livrer à un plagiat par « patchwork », les étudiants prennent souvent un texte copié et le soumettent à un outil de paraphrase basé sur l'IA. Cela permet à cet outil de remplacer les mots du texte copié par des synonymes, ce qui rend la détection très difficile pour un logiciel anti-plagiat classique.
Un logiciel de détection de plagiat parcourt Internet et des bases de données propriétaires afin de repérer les correspondances directes, mot pour mot, avec des textes existants. Un outil de détection basé sur l'IA analyse la prévisibilité statistique et les schémas syntaxiques d'un texte donné pour déterminer s'il a été généré par une intelligence artificielle.
Les logiciels anti-plagiat classiques comme TurnItIn ne détecteront pas les nouveaux contenus générés par l'IA, car ceux-ci n'existent nulle part sur Internet ; il n'y a donc aucune source à laquelle les comparer. En revanche, un détecteur d'IA classique ne repérera pas un étudiant qui copie-colle manuellement du contenu provenant d'un manuel universitaire peu connu.
En ce qui concerne le choix entre un vérificateur de dissertations basé sur l'IA et un logiciel anti-plagiat, la réponse est la suivante : pour détecter les formes modernes de plagiat par assemblage, les enseignants ont besoin d'un outil intégré capable de comparer les textes à une base de données afin de repérer les cas de plagiat classiques, tout en analysant les schémas linguistiques propres à l'IA qui indiquent qu'un texte a été généré par une intelligence artificielle.
La réponse à cette question est « oui ». Vous pouvez utiliser des détecteurs d'IA pour repérer le plagiat par assemblage. Cependant, tous les détecteurs d'IA ne sont pas capables de vérifier le plagiat ou de détecter les textes paraphrasés générés par l'IA : vous avez besoin d'une plateforme avancée, comme Pangram, qui combine une détection d'IA de pointe et une analyse complète du plagiat au sein d'un seul tableau de bord.
Pour détecter le plagiat par assemblage, Pangram utilise l’« analyse par segments ». Cette technique décompose les documents complexes segment par segment et permet ainsi d’identifier précisément quelles phrases ont été rédigées par une personne, lesquelles ont été copiées à partir d’une source externe (avec un lien vers cette source) et lesquelles ont été générées par un modèle de langage de grande capacité (LLM).
Outre l'analyse détaillée des segments de texte au sein d'un document, Pangram 3.0 est même capable d'identifier le degré d'intervention humaine. Cela vous permet de déterminer si une phrase est « entièrement rédigée par un humain », « légèrement assistée par l'IA » ou « entièrement générée par l'IA ». Cette fonctionnalité fait de Pangram 3.0 l'outil idéal pour démêler les essais hétéroclites.
Si un devoir est signalé pour plagiat fragmentaire ou utilisation mixte de l'IA, les enseignants devraient utiliser le rapport d'analyse détaillé de Pangram comme outil de diagnostic. Servez-vous de ce diagnostic pour engager un dialogue avec l'élève sur les bonnes pratiques de citation et l'aider à trouver sa propre voix en tant qu'élève et auteur.
Même si cela peut être tentant, la mentalité du « policier » n'est guère recommandée. Utilisez l'analyse détaillée fournie par Pangram pour montrer aux élèves à quel moment leur travail a franchi la ligne qui sépare « l'utilisation de l'IA pour une vérification grammaticale » de « l'externalisation de la rédaction ».
Indépendamment de ce qui précède, il y a un autre point à garder à l'esprit : les outils gratuits et basiques de détection de l'IA sont sujets aux faux positifs. Si vous en utilisez un et qu'il indique qu'un texte a été généré par l'IA, il est possible que cette évaluation soit erronée. Avant de porter des accusations dans un contexte universitaire, il serait préférable d'utiliser un outil de niveau professionnel présentant un taux de faux positifs quasi nul, comme Pangram.
Le plagiat « patchwork » ne consiste plus à mélanger des ouvrages de bibliothèque ou à compiler des bribes provenant de pages Wikipédia disparates ; il s'agit désormais de brouiller les frontières entre la pensée humaine, la propriété intellectuelle copiée et la génération automatique.
En combinant l'intelligence artificielle et un logiciel de détection de plagiat, les enseignants peuvent évaluer en toute confiance les travaux des élèves afin de s'assurer qu'il s'agit d'un véritable apprentissage, et non d'une simple mémorisation assistée par l'IA, de plagiat ou de copier-coller.
Obtenez une vue d'ensemble de l'authenticité du texte. Vérifiez à la fois la présence d'IA et le plagiat en un seul clic :
