Annonce d'un nouveau partenariat avec Proofig ! En savoir plus

Comment Quora utilise Pangram pour traiter les réponses générées par l'IA

Max Spero
26 septembre 2024

En avril 2024, Pangram Labs s'est associé à Quora pour l'aider à lutter contre les spammeurs qui utilisent ChatGPT pour répondre aux publications avec des réponses inauthentiques générées par l'IA.

Quora est l'un des plus grands sites web au monde, classé 33e site web le plus fréquenté au monde et enregistrant plus d'un milliard de visites par mois en août 2024 (Source : Semrush). Quora permet aux utilisateurs de poster des questions, qui seront vues et répondues par d'autres personnes naviguant sur le site.

« Notre mission consiste à partager et à développer les connaissances mondiales. Nous sommes convaincus que beaucoup de connaissances sont enfermées dans l'esprit des gens, et que si nous posons les bonnes questions aux bonnes personnes, nous pouvons extraire ces connaissances. »

Lexie Wu, chef de produit groupe responsable de la modération chez Quora

Quel est le problème avec les réponses fournies par l'IA ?

Exemple de réponse rédigée par l'IA

L'IA générative permet aux spammeurs de générer des centaines, voire des milliers de réponses d'apparence authentique sans grand effort. On pourrait avancer qu'une réponse fournie par l'IA reste globalement positive. Les utilisateurs obtiennent une réponse qui est peut-être de qualité médiocre ou moyenne, mais souvent correcte dans son orientation. C'est mieux que pas de réponse du tout, n'est-ce pas ?

Dans l'absolu, peut-être, mais les réponses fournies par l'IA sur Quora ont plusieurs effets indésirables.

  1. Lorsqu'une question a déjà reçu une réponse, cela dissuade les autres de prendre le temps de rédiger leur propre réponse. Ainsi, même si une question a reçu une réponse satisfaisante de la part de l'IA, celle-ci rend moins probable que quelqu'un choisisse de partager sa propre expérience du monde réel.
  2. L'IA évince les publications authentiques. Comme sur de nombreuses plateformes, les vues et l'engagement sont un jeu à somme nulle. Chaque fois qu'un utilisateur voit du contenu généré par l'IA dans son fil d'actualité ou son résumé, d'autres créateurs réels perdent l'engagement qu'ils méritent.
  3. Risque lié à la réputation. Les gens peuvent savoir quand une réponse qu'ils lisent a été rédigée par une IA. Cela soulève la question suivante : pourquoi visiter Quora si c'est pour lire des réponses générées par une IA ? Pourquoi ne pas simplement aller sur ChatGPT ? Quora propose une offre différente de celle de ChatGPT, à savoir des réponses authentiques provenant de personnes réelles, et veille à ce que cela reste le cas en modérant sa plateforme.

Pourquoi utiliser Pangram ?

Il est parfois difficile de déterminer à l'œil nu si un texte a été rédigé par une IA. Dans d'autres cas, cette tâche est simplement fastidieuse et nécessite qu'un modérateur lise attentivement le texte pendant un certain temps avant d'être certain de son verdict. L'automatisation de ce processus libère ce qui serait autrement un travail de modération coûteux, permettant ainsi d'économiser du temps et de l'argent à long terme.

Bien qu'il existe quelques solutions open source visant à résoudre le problème de la détection de l'IA pour GPT-2, aucune solution n'a bien fonctionné sur GPT-4, le modèle linguistique à grande échelle (LLM) le plus couramment utilisé. Des plateformes telles que Quora recherchent une solution capable de classer les résultats de modèles avancés tels que GPT-4. Idéalement, une solution devrait continuer à fonctionner avec les nouveaux LLM, car de nouveaux modèles linguistiques de pointe sont lancés tous les deux mois.

Pangram, avec ses évaluations robustes et une précision plus de 100 fois supérieure à celle de ses concurrents tels que GPTZero, était l'une des seules options capables de détecter de manière fiable le contenu écrit par GPT-4 en avril 2024 et reste aujourd'hui, et de loin, le modèle de détection IA le plus précis.

De plus, le pipeline de données de Pangram intègre une robustesse inhérente aux futures versions de LLM. Il est capable de générer des données d'entraînement synthétiques et d'entraîner un nouveau modèle dans les 24 heures suivant la mise à disposition d'un LLM. En juillet 2024, Pangram a étendu la prise en charge linguistique à plus de 20 langues et continue d'apporter des améliorations à la modélisation afin de garantir une grande précision à ses clients.

Impact

En septembre 2024, Quora avait identifié plus d'un million de publications générées par l'IA, améliorant ainsi la qualité du contenu sur l'ensemble du site et préservant sa réputation de source d'informations authentique et fiable.

Pangram continue d'agir comme un multiplicateur de force pour les équipes Trust & Safety, en leur fournissant les outils dont elles ont besoin pour définir en toute confiance des politiques relatives au contenu généré par l'IA.




Vous avez un cas d'utilisation pour la détection par IA ? Contactez-nous à l'adresse info@pangram.com!

Abonnez-vous à notre newsletter
Nous partageons chaque mois les dernières avancées de nos recherches en matière de détection de l'IA.