KI-Ausbildung

Ein Rundgang durch die am häufigsten verwendeten Ausdrücke im Bereich der KI

21. Februar 2025

Inhaltsverzeichnis

Teil 1: KI-Artefakte
Teil 2: Abgedroschene Redewendungen
Teil 3: Warum verwendet KI immer wieder dieselben Formulierungen?
Bonus: Die Lieblings-N-Gramme unseres Teams

Wie wir letzte Woche besprochen haben, neigt KI dazu, bestimmte Wörter und Ausdrücke übermäßig häufig zu verwenden. Einige davon fallen Ihnen vielleicht spontan ein: von „ein Beweis für“ bis hin zu „sich vertiefen“. Wenn man genügend solcher Ausdrücke sieht, kann das ein deutlicher Hinweis darauf sein, dass der Text, mit dem man es zu tun hat, von einer KI generiert wurde, aber es gibt viel zu viele davon, als dass eine einzelne Person den Überblick behalten könnte.

Um dieses Problem zu lösen, haben wir kürzlich ein Tool namens „AI phrases“ eingeführt, mit dem wir genau diese Formulierungen hervorheben. Im Rahmen der Entwicklung dieses Tools haben wir einen umfangreichen Datensatz mit den am häufigsten verwendeten KI-Formulierungen erstellt. In diesem Artikel stellen wir Ihnen einige der gängigsten KI-Formulierungen aus unserem Datensatz vor und erklären, wie Sie diese nutzen können, um Ihr Gespür für KI-generierte Texte zu schärfen.

Teil 1: KI-Artefakte

Beginnen wir mit dem Offensichtlichsten: Manchmal sagt eine KI einem tatsächlich, dass sie eine KI ist! Oft geschieht dies im Zusammenhang mit einer Ablehnung. Wenn ein Nutzer eine KI um etwas bittet, wozu sie nicht programmiert wurde, muss sie dem Nutzer mitteilen, dass sie der Anfrage nicht nachkommen kann, und in diesem Zusammenhang gibt das Modell oft zu erkennen, dass es sich um eine KI handelt. Viele Ablehnungen durch KI beginnen mit dem Satz „Als KI-Sprachmodell…“. Daraus folgt, dass diese Art von Satz in KI-Texten recht häufig vorkommt, in menschlichen Texten hingegen äußerst selten. Die Zahlen bestätigen dies! Viele unserer häufigsten KI-Sätze sind selbstreferenziell.

Phrase	Häufiger
Als KI-Sprachmodell	294,000x
Ich habe keine persönlichen	67,000x
Leider habe ich nicht genug.	54,000x
Sprachmodell, ich kann nicht	53,000x

Teil 2: Abgedroschene Redewendungen

KI-Artefakte gehören zu den „am häufigsten überstrapazierten“ KI-Begriffen, sind aber letztlich ziemlich offensichtlich und daher eher uninteressant. Nun kommen wir zum interessanten Teil: Begriffe, die in KI-Texten zwar tatsächlich überrepräsentiert sind, aber nichts damit zu tun haben, „eine KI zu sein“. Hier sind ein paar Beispiele:

Phrase	Häufiger
als ergreifend	49,000x
Als eindringliche Erinnerung	43,000x
Erinnerung an das Beständige	31,000x
stand vor zahlreichen Herausforderungen	30,000x
Unsere Ergebnisse liefern neue Erkenntnisse über	22,000x
in das komplexe Zusammenspiel	21,000x
dient als leistungsstarkes	10,000x
wertvolle Einblicke in	5,000x
dient als Zeugnis	4,000x
neu entdeckte Sinnhaftigkeit	4,000x
selbst angesichts des Unvorstellbaren	3,000x
Erinnerung an das Potenzial	3,000x

Teil 3: Warum verwendet KI immer wieder dieselben Formulierungen?

Es ist leicht nachvollziehbar, warum eine KI, die sagt „Als KI…“, in KI-Texten weitaus häufiger vorkommt. Aber warum tauchen die scheinbar zusammenhanglosen Phrasen in Teil 2 häufiger auf? Zunächst einmal gibt es ein Phänomen, das als „Mode Collapse“ bekannt ist, bei dem KI-Ausgaben übermäßig allgemein oder repetitiv werden, weil sie sich auf Wortfolgen mit hoher Wahrscheinlichkeit stützen. Mode Collapse…

Darüber hinaus ist es nach dem Training gängige Praxis, RLHF (Reinforcement Learning from Human Feedback) anzuwenden. Bei diesem Verfahren bewerten menschliche Annotatoren KI-generierte Texte anhand einer Reihe von Merkmalen, um bestimmte Muster zu fördern und andere zu unterbinden. Wenn bestimmte Antworten oder Formulierungen im Laufe dieses Prozesses von diesen menschlichen Annotatoren wahrscheinlich positiv bewertet werden, kommen sie immer häufiger vor.

Folglich lassen sich einige dieser überstrapazierten Formulierungen eher als charakteristisches Merkmal bestimmter Modelle, Architekturen und Trainingsprozesse betrachten und nicht nur als typisches Kennzeichen des KI-Schreibens an sich. Eine Studie von Jenna Russell, Marzena Karpinska und Mohit Iyyer von der University of Maryland zeigt, dass verschiedene Modelle tatsächlich unterschiedliche bevorzugte Formulierungen aufweisen:

überbeansprucht

überbeansprucht

Dies lässt vermuten, dass verschiedene Modelle, die mit unterschiedlichen Datensätzen und Optimierungsstrategien trainiert wurden, ihre eigenen, spezifischen Tendenzen bei der Phrasenwiederholung entwickeln können.

Bonus: Die Lieblings-N-Gramme unseres Teams

Im Rahmen unserer Arbeit hat unser Team unzählige Stunden damit verbracht, von KI generierte Texte zu lesen und zu analysieren. Dabei haben wir natürlich eine Vorliebe für einige dieser Formulierungen entwickelt:

Hier sind die Lieblings-KI-Phrasen unseres Teams:

Max (CEO): „In der sich ständig weiterentwickelnden“ (11.000x)
Bradley (CTO): „wichtig zu beachten“ (3.000x)
Lu (Gründungsingenieur): „komplexe Natur“ (6.000x)
Elyas (Gründungsingenieur): „lebendiges Mosaik“ (17.000x)

Elyas MasrourGründungsingenieur

Elyas Masrour ist Gründungsingenieur bei Pangram. Seit er direkt nach seinem Abschluss an der University of Maryland als zweiter Mitarbeiter zu Pangram kam, hat er wichtige Infrastrukturkomponenten wie die Modell-Serving-API, rollenbasierte Zugriffskontrollen und unterstützende Evidenz-Pipelines aufgebaut. Elyas arbeitet zudem eng mit dem Forschungsteam an Projekten wie adversarialer Robustheit, Modellinterpretierbarkeit und der Erkennung heterogener gemischter Inhalte zusammen. Außerhalb der Arbeit genießt Elyas die vielfältigen Ausdrucksformen menschlicher Kreativität, darunter Filmemachen, Lesen und das Erkunden der Stadt.

Mehr von Elyas Masrour

Weiterführende Literatur

Wird Google im Jahr 2026 von KI generierte Inhalte abstrafen?

Wird Google im Jahr 2026 von KI generierte Inhalte abstrafen?

Bestraft Google KI-Inhalte? Manche glauben, dass Google ständig nach KI-Inhalten Ausschau hält und diese – unter sonst gleichen Bedingungen – schlechter bewertet. Die Realität ist jedoch differenzierter.

Alex Roitman30. Januar 2026

Der Stand der akademischen Integrität und der KI-Erkennung im Jahr 2025

Der Stand der akademischen Integrität und der KI-Erkennung im Jahr 2025

Bradley Emi, CTO von Pangram Labs, hielt auf der ICAI-Konferenz einen Vortrag über den aktuellen Stand der KI-Erkennung.

Destiny Akinode4. Dezember 2025

Wie man von KI verfasste Texte erkennt

Wie man von KI verfasste Texte erkennt

ChatGPT und andere große Sprachmodelle (LLMs), die zusammenfassend oft als „KI“ bezeichnet werden, haben sich zu immer beliebteren Werkzeugen entwickelt.

Max Spero17. Juni 2024

Alles über Fehlalarme bei KI-Detektoren

Alles über Fehlalarme bei KI-Detektoren

Ein detaillierter Einblick, wie Pangram branchenführende Falsch-Positiv-Raten bei der KI-Erkennung erzielt – mit einer Falsch-Positiv-Rate von 1 zu 10.000.

Bradley Emi27. März 2025

KI-Prüfprogramme für Lehrkräfte: Warum Schulen KI-Erkennungswerkzeuge brauchen

KI-Prüfprogramme für Lehrkräfte: Warum Schulen KI-Erkennungswerkzeuge brauchen

Ich treffe viele Lehrer, die in Bezug auf die Überprüfung von Schülertexten auf KI dieselbe Ansicht vertreten. Oft höre ich: „Ich kenne die Schreibweise meiner Schüler, daher brauche ich keine KI-Erkennungssoftware.“

Jason Nicholson4. Februar 2025

Welchen KI-Detektor sollten Hochschulen einsetzen? Der akademische Standard 2026

Welchen KI-Detektor sollten Hochschulen einsetzen? Der akademische Standard 2026

Der akademische Bereich sieht sich mit einer explosionsartigen Zunahme des Einsatzes generativer KI konfrontiert. Die Universitäten mussten ihre Richtlinien zur akademischen Integrität rasch überarbeiten.

Alex Roitman11. Mai 2026

Abonnieren Sie unsere Updates unter

Bleiben Sie mit unseren aktuellen Neuigkeiten und Angeboten auf dem Laufenden.

soc2

SOC2 TYP 2

Verifiziert durch AssuranceLab

© 2025 Pangram. Alle Rechte vorbehalten.

info@pangram.com

Treten Sie unserer Community bei

© 2025 Pangram. Alle Rechte vorbehalten.