Annonce d'un nouveau partenariat avec Proofig ! En savoir plus
Aujourd'hui, OpenAI a lancé GPT-4.5 : le dernier et le plus grand modèle linguistique disponible à ce jour, ainsi qu'une mise à jour importante de ChatGPT. Bien qu'il n'atteigne pas des statistiques de référence comparables à celles des modèles de raisonnement tels que DeepSeek R1 et OpenAI O3, GPT-4.5 représente le lancement de modèle le plus important et le plus attendu de l'année jusqu'à présent, et nous sommes impatients de le tester. OpenAI affirme que la qualité de l'écriture a été considérablement améliorée, et les commentaires sur ses performances fleurissent déjà sur les réseaux sociaux.
Nous avons voulu répondre à la question que beaucoup se posent : à mesure que les modèles s'améliorent, pouvons-nous encore détecter les textes générés par l'IA avec GPT-4.5 ? Nous avons effectué un test rapide aujourd'hui pour le découvrir.
Nous avons commencé par échantillonner 11 invites représentatives des tâches d'écriture quotidiennes que l'on pourrait demander à ChatGPT.
Voici les invites que nous avons utilisées :
Nous avons essayé de rendre les invites aussi diverses et variées que possible, et nous avons également essayé de rédiger des invites qui présentaient une différence qualitative significative par rapport aux modèles GPT précédents : en d'autres termes, si le modèle avait la possibilité d'être créatif et de montrer son côté « époustouflant », nous avons fait de notre mieux pour offrir cette opportunité à GPT-4.5.
| Invite | Pangram | Principal concurrent 1 | Principal concurrent 2 |
|---|---|---|---|
| Conservation des koalas | 100% | 100% | 100% |
| Courriel du journal | 100% | 100% | 67% |
| Semi-conducteur à température ambiante | 100% | 56% | 86% |
| Uniformes scolaires | 85% | 100% | 80% |
| Journal poétique | 100% | 100% | 15% |
| Critique d'Escape Room | 100% | 81% | 56% |
| Film russe E-mail | 100% | 100% | 91% |
| Scène d'atterrissage sur Mars | 100% | 43% | 7% |
| Script Komodo Dragon | 98% | 88% | 0% |
| Poème de rupture pour Halloween | 100% | 100% | 0% |
| Scène de poursuite à Venise | 100% | 49% | 9% |
Pangram est capable de détecter les 11 essais rédigés par GPT-4.5, même sans aucune donnée GPT-4.5 dans l'ensemble d'entraînement. En comparaison, deux principaux concurrents dans le domaine de la détection de l'IA présentent des résultats au mieux inégaux. Alors que Pangram est capable de prédire avec certitude que 10 des 11 échantillons ont une probabilité d'IA de 98 % ou plus, la concurrence exprime souvent un degré élevé d'incertitude ou, dans le pire des cas, prédit avec une grande certitude que le texte est généré par un humain.
Pangram est lui-même un modèle d'apprentissage automatique de grande envergure qui a examiné des millions d'exemples de textes générés par des humains et par l'IA. Les modèles de grande envergure ont tendance à mieux généraliser et à repérer des schémas subtils dans les textes générés par l'IA que d'autres ne sont pas en mesure de détecter. Notre approche d'apprentissage actif réduit encore davantage notre taux de faux positifs tout en augmentant notre sensibilité, ce qui permet au modèle de bien fonctionner à grande échelle et de généraliser à de nouveaux LLM de manière beaucoup plus efficace que nos concurrents. De plus, l'importance que nous accordons à la qualité et à la diversité des données nous permet d'obtenir un modèle qui a beaucoup plus d'expérience dans la compréhension des détails les plus fins que d'autres modèles ne peuvent pas détecter.
Oui, notre outil de détection IA reste très efficace pour détecter les textes générés par GPT-4.5.
Si vous vous demandez comment Pangram se comportera lorsqu'un nouveau modèle plus performant sera lancé, sachez que Pangram a passé avec succès le test du lancement d'IA le plus attendu depuis longtemps, sans aucun réentraînement. Si vous ne voulez pas que votre logiciel de détection d'IA cesse soudainement de fonctionner lors de la prochaine mise à jour du modèle OpenAI, essayez Pangram dès aujourd'hui.
Pour plus d'informations sur nos recherches ou pour obtenir des crédits gratuits afin de tester notre modèle sur GPT-4.5, veuillez nous contacter à l'adresse info@pangram.com.
