Neu

Erkenne sofort, was auf Twitter, LinkedIn, Substack und anderen Plattformen von Menschen und was von KI stammt. Hol dir unsere neue Chrome-Erweiterung.

Weitere Informationen
Fallstudien

Wie schneidet Pangram im Vergleich zu GPTZero ab?

22. Januar 2026

Der Markt für KI-Erkennungswerkzeuge besteht heute aus mehreren großen Anbietern. Vielleicht haben Sie schon von ihnen gehört: Pangram, GPTZero, Turnitin, ZeroGPT und andere. Einen umfassenden Überblick darüber, wie diese Tools im Vergleich abschneiden, finden Sie in unserem Leitfaden zu den derzeit besten KI-Erkennungswerkzeugen.

Viele dieser Unternehmen aktualisieren regelmäßig ihre Modelle und veröffentlichen Zahlen zu ihrer Leistung. Vor kurzem hat GPTZero ein Sommer-Modell-Update veröffentlicht und neue Zahlen zur Leistung verschiedener neuer Modelle bekannt gegeben. In diesem Blogbeitrag vergleichen wir die Leistung des neuen Modells von GPTZero mit der KI-Erkennung von Pangram, einschließlich der neuesten GPT-5-Modelle.

Pangram vs. GPTZero: Veröffentlichte Zahlen

ModellPangram-ErkennungsrateGPTZero-ErkennungsrateBesserer Detektor
GPT-599.81%95.0%Pangram
GPT-5-Chat-Neueste99.97%Nicht getestetNicht zutreffend
GPT-5-Mini99.92%92.2%Pangram
GPT-5-Nano99.97%96.1%Pangram
GPT-OSS-120b100.00%Nicht getestetNicht zutreffend
GPT-OSS-20b99.74%Nicht getestetNicht zutreffend
GPT4.199.48%96.8%Pangram
GPT4.1-Mini99.94%98.7%Pangram
o399.86%89.9%Pangram
o3-mini100.00%98.4%Pangram
Gemini 2.5 Pro99.91%95.7%Pangram
Gemini 2.5 Flash99.75%98.2%Pangram
Claude Sonett 499.91%99.1%Pangram

Hinweis: GPTZero veröffentlicht seine internen Bewertungsdatensätze nicht öffentlich, daher stammen diese Zahlen nicht aus genau denselben Dokumenten. Darüber hinaus gibt GPTZero die Anzahl der getesteten Dokumente nicht bekannt, sodass wir auch die Menge nicht vergleichen können. Für die Leistungszahlen von Pangram haben wir jedoch Tausende von Dokumenten pro Modell sowie eine Vielzahl von Domänen und Prompt-Schemata ausgewertet, um den realen Einsatz zu simulieren.

Darüber hinaus beschränkt sich die Genauigkeit von Pangram nicht nur darauf, die meisten KI-Dokumente zu kennzeichnen. Pangram ist auch Marktführer bei der Aufrechterhaltung niedriger Falsch-Positiv-Raten. Es ist für uns eine wichtige Priorität, von Menschen verfasste Dokumente nicht als KI-generiert zu kennzeichnen. Nachstehend sind die Unterschiede zwischen den gemeldeten Falsch-Positiv-Raten für Pangram und GPTZero aufgeführt:

PangramGPTZero
Falsch-positiv-Rate (%)0.01%1%
Falsch-positiv-Rate (#)~1 von 10.000 Dokumenten~1 von 100 Dokumenten

GPTZero-Blogbeitrag zur Falsch-Positiv-Rate

Hier sehen wir die Leistung von GPTZero mit einer Falsch-Positiv-Rate (FPR) von 1 %.

Was zeigen die Forschungsergebnisse? Pangram vs. GPTZero

Pangram und GPTZero stehen auch in begutachteten Forschungsarbeiten zum Thema KI in direktem Wettbewerb zueinander. Dies kommt am besten in der aktuellen Studie der University of Maryland zum Ausdruck :„Personen, die ChatGPT häufig für Schreibaufgaben nutzen, sind präzise und zuverlässige Detektoren für KI-generierte Texte.“ Diese Studie untersuchte die Fähigkeit erfahrener menschlicher Annotatoren, den Unterschied zwischen von Menschen und von KI generierten Texten zu klassifizieren.

Im Rahmen der Studie wurden die menschlichen Annotatoren mit kommerziell erhältlichen und Open-Source-Detektoren verglichen. Pangram schnitt besser ab als jeder einzelne menschliche Detektor und auch besser als alle kommerziellen Alternativen, einschließlich GPTZero.

GPT-4oClaude
Pangram100%100%
GPTZero100%97.6%
Kommentator 196.7%100%
Kommentator 296.7%100%
Kommentator 386.7%80%
Kommentator 490.0%96.7%
Annotator 593.3%93.3%

Mehrsprachige Aufführung

Die Unterschiede zwischen dem Flaggschiffmodell von Pangram und GPTZero enden hier jedoch nicht. Beide Modelle sind „mehrsprachig“, d. h. sie können KI nicht nur in Englisch, sondern auch in anderen Sprachen erkennen. Pangram ist in allen 20 meistverwendeten Sprachen im Internet mehrsprachig. GPTZero unterstützt Englisch, Französisch und Spanisch. Hier sind die Sprachen, in denen jedes Modell getestet wurde:

SprachePangram-Falsch-Positiv-Rate (FPR)GPTZero-Falsch-Positiv-Rate (FPR)Pangram-KI-ErkennungsrateGPTZero KI-Erkennungsrate
Spanisch0.00%5.6%100.0%96.4%
Französisch0.00%3.1%100.0%93.1%
Arabisch0.10%Nicht getestet100.0%Nicht getestet
Tschechisch0.00%Nicht getestet99.89%Nicht getestet
Deutsch0.00%Nicht getestet99.68%Nicht getestet
Griechisch0.00%Nicht getestet99.79%Nicht getestet
Persisch0.00%Nicht getestet100.0%Nicht getestet
Hindi0.00%Nicht getestet99.58%Nicht getestet
Ungarisch0.10%Nicht getestet99.05%Nicht getestet
Italienisch0.00%Nicht getestet100.0%Nicht getestet
Japanisch0.00%Nicht getestet100.0%Nicht getestet
Niederländisch0.10%Nicht getestet100.0%Nicht getestet
Polnisch0.00%Nicht getestet100.0%Nicht getestet
Portugiesisch0.00%Nicht getestet100.0%Nicht getestet
Rumänisch0.10%Nicht getestet100.0%Nicht getestet
Russisch0.00%Nicht getestet100.0%Nicht getestet
Schwedisch0.00%Nicht getestet99.89%Nicht getestet
Türkisch0.00%Nicht getestet99.79%Nicht getestet
Ukrainisch0.00%Nicht getestet99.89%Nicht getestet
Urdu0.00%Nicht getestet98.84%Nicht getestet
Vietnamesisch0.00%Nicht getestet99.89%Nicht getestet
Chinesisch0.00%Nicht getestet99.89%Nicht getestet

Weitere Informationen zur Leistung von Pangram bei mehrsprachigen Texten finden Sie in diesem Blogbeitrag.

ESL-Leistung

Darüber hinaus wurden beide Modelle unter besonderer Berücksichtigung der ESL-Leistung trainiert, da allgemein bekannt ist, dass KI-Detektoren gegenüber Nicht-Muttersprachlern voreingenommen sein können. Sowohl GPTZero als auch Pangram haben insbesondere Ergebnisse zu ESL-Texten veröffentlicht. Sehen Sie unten, wie sie im Vergleich abschneiden:

Falsch-positiv-RateStichprobengröße
Pangram0.032%25,021
GPTZero1.1%91

Weitere Informationen über Pangrams Ansatz für ESL-Texte finden Sie in diesem Blogbeitrag: https://www.pangram.com/blog/how-accurate-is-pangram-ai-detection-on-esl

Unveröffentlichte Modelle und GPT-5

Ein weiteres Anliegen für diejenigen, die sich für KI-Erkennung interessieren, ist die Leistung bei noch nicht veröffentlichten Modellen. Da der KI-Wettstreit weiter zunimmt, veröffentlichen große KI-Labore und kleine Start-ups regelmäßig wichtige Modelle. Es ist wichtig, dass eine KI-Erkennungslösung auch bei Modellen, die sie möglicherweise nicht direkt trainieren konnte, weiterhin genaue Ergebnisse liefert.

Die kürzlich erfolgte Veröffentlichung von GPT-5 bot eine großartige Gelegenheit, dies herauszufinden! Innerhalb weniger Stunden nach der Veröffentlichung des neuen Modells testete das Pangram-Team die Leistung von GPTZero und Pangram anhand verschiedener Arten von Eingabeaufforderungen. Hier sind die Ergebnisse:

PangramGPTZero
Dokument 1100%2%
Dokument 2100%0%
Dokument 3100%0%
Dokument 4100%0%
Dokument 5100%9%
Dokument 699%0%
Dokument 7100%0%
Dokument 8100%0%
Dokument 9100%29%
Dokument 10100%0%
Dokument 11100%10%

Hinweis: GPTZero hat inzwischen ein Modell-Update veröffentlicht, das angeblich auf GPT-5 besser funktioniert! Weitere Details zu unserem ursprünglichen Vergleich finden Sie in diesem Blogbeitrag. Darüber hinaus empfehlen wir Nutzern, eigene Tests durchzuführen, um die Leistung zu einem bestimmten Zeitpunkt zu vergleichen.

Schlussfolgerung

Letztendlich ist Pangram weiterhin die robuste und zuverlässige Wahl für die Erkennung von KI-generierten Inhalten. Ganz gleich, ob Sie Lösungen für den Bildungsbereich, das Verlagswesen, die Moderation von Inhalten oder noch speziellere Anforderungen benötigen – wir bieten Ihnen eine genaue und faire KI-Erkennung. Erfahren Sie mehr in unserem Blog oder kontaktieren Sie uns unter info@pangram.com.


Bradley Emi
Bradley EmiCTO, Mitbegründer

Bradley ist KI-Forscher und Experte für die Entwicklung von Deep-Learning-Produkten in der Industrie. Zuletzt leitete er die Deep-Learning-Forschungsgruppe bei Absci, einem Unternehmen für generative KI-Arzneimittelforschung, und war zuvor Mitglied des Kernteams für Computer Vision bei Tesla Autopilot.

Während seines Studiums verfasste Bradley mehrere Publikationen im Bereich Deep Learning-Forschung am Stanford Vision Lab. Er hat einen Bachelor of Science in Physik und einen Master of Science in Künstlicher Intelligenz von der Stanford University. Neben KI interessiert er sich auch für Bildung und Philosophie und ist begeisterter Golfer.

Mehr von Bradley Emi

Weiterführende Literatur

Wie Gradpilot Pangram nutzt, um Schülern dabei zu helfen, ihre Stimme zu finden
Fallstudien

Wie Gradpilot Pangram nutzt, um Schülern dabei zu helfen, ihre Stimme zu finden

15. September 2025
Welcher KI-Detektor ist am genauesten? 30 Tools im Test (2026)
Fallstudien

Welcher KI-Detektor ist am genauesten? 30 Tools im Test (2026)

7. Januar 2026
Machen Sie Ihr Unternehmen LLM- und GenAI-sicher
Fallstudien

Machen Sie Ihr Unternehmen LLM- und GenAI-sicher

30. Januar 2024
Wie man KI-Bewertungen erkennt
Fallstudien

Wie man KI-Bewertungen erkennt

5. Dezember 2023
Drei Prozent der Rezensionen auf der Startseite von Amazon werden mittlerweile von KI generiert
Fallstudien

Drei Prozent der Rezensionen auf der Startseite von Amazon werden mittlerweile von KI generiert

4. Mai 2026
AI-Konferenzbeiträge werden zunehmend von KI verfasst: Anstieg um 370 % seit 2023
Fallstudien

AI-Konferenzbeiträge werden zunehmend von KI verfasst: Anstieg um 370 % seit 2023

30. September 2024