Neu

Erkenne sofort, was auf Twitter, LinkedIn, Substack und anderen Plattformen von Menschen und was von KI stammt. Hol dir unsere neue Chrome-Erweiterung.

Weitere Informationen
Bildung

Ein Streifzug durch die am häufigsten verwendeten Phrasen der KI

21. Februar 2025

Wie wir letzte Woche besprochen haben, neigt KI dazu, bestimmte Wörter und Ausdrücke übermäßig zu verwenden. Einige davon fallen Ihnen vielleicht spontan ein: von „ein Beweis für“ bis „vertiefen“. Wenn Sie genügend dieser Ausdrücke sehen, kann dies ein deutlicher Hinweis darauf sein, dass es sich bei dem Text, mit dem Sie sich beschäftigen, um einen KI-generierten Text handelt, aber es gibt viel zu viele davon, als dass eine einzelne Person sie alle im Blick behalten könnte.

Um dieses Problem zu lösen, haben wir kürzlich ein Tool namens „AI phrases“ eingeführt, mit dem wir diese Ausdrücke gezielt hervorheben. Im Rahmen der Entwicklung dieses Tools haben wir einen umfangreichen Datensatz mit den am häufigsten verwendeten AI-Ausdrücken erstellt. In diesem Artikel stellen wir Ihnen einige der häufigsten AI-Ausdrücke aus unserem Datensatz vor und erklären, wie Sie diese nutzen können, um Ihr Gespür für KI-generierte Texte zu schärfen.

Teil 1: KI-Artefakte

Wir sollten mit dem Offensichtlichsten beginnen: Manchmal sagt Ihnen eine KI tatsächlich, dass sie eine KI ist! Oft geschieht dies als Folge einer Ablehnung. Wenn ein Benutzer eine KI um etwas gebeten hat, was ihr nicht tun darf, muss sie dem Benutzer mitteilen, dass sie der Anfrage nicht nachkommen kann, und dabei gibt das Modell oft zu erkennen, dass es sich um eine KI handelt. Viele Ablehnungen durch KI beginnen mit dem Satz „Als KI-Sprachmodell ...“. Daraus folgt, dass solche Sätze in KI-Texten recht häufig vorkommen, in menschlichen Texten hingegen äußerst selten sind. Die Zahlen bestätigen dies! Viele unserer häufigsten KI-Sätze sind selbstreferenziell.

PhraseHäufiger
Als KI-Sprachmodell294,000x
Ich habe keine persönlichen67,000x
Leider habe ich nicht genug.54,000x
Sprachmodell, ich kann nicht53,000x

Teil 2: Überstrapazierte Redewendungen

KI-Artefakte gehören zu unseren „am häufigsten verwendeten“ KI-Ausdrücken, sind aber letztendlich ziemlich offensichtlich und daher eher uninteressant. Nun kommen wir zum interessanten Teil: Ausdrücke, die in KI-Texten zwar überrepräsentiert sind, aber nichts mit „KI sein“ zu tun haben. Hier sind einige Beispiele:

PhraseHäufiger
als ergreifend49,000x
Als eindringliche Erinnerung43,000x
Erinnerung an das Beständige31,000x
stand vor zahlreichen Herausforderungen30,000x
Unsere Ergebnisse liefern neue Erkenntnisse über22,000x
in das komplexe Zusammenspiel21,000x
dient als leistungsstarkes10,000x
wertvolle Einblicke in5,000x
dient als Zeugnis4,000x
neu entdeckte Sinnhaftigkeit4,000x
selbst angesichts des Unvorstellbaren3,000x
Erinnerung an das Potenzial3,000x

Teil 3: Warum verwendet KI bestimmte Ausdrücke übermäßig häufig?

Es ist leicht zu verstehen, warum eine KI, die „Als KI ...“ sagt, in KI-Texten viel häufiger vorkommt. Aber warum kommen die scheinbar nicht zusammenhängenden Phrasen in Teil 2 häufiger vor? Zunächst einmal gibt es ein Phänomen, das als „Modus-Kollaps“ bekannt ist, bei dem KI-Ausgaben durch die Verwendung von Wortfolgen mit hoher Wahrscheinlichkeit zu allgemein oder repetitiv werden. Modus-Kollaps ...

Darüber hinaus ist es nach dem Training üblich, RLHF (Reinforcement Learning from Human Feedback) durchzuführen. Während dieses Prozesses bewerten menschliche Annotatoren den von der KI generierten Text anhand einer Reihe von Attributen, um bestimmte Muster zu fördern und andere zu unterbinden. Wenn bestimmte Antworten oder Formulierungen während dieses Prozesses von diesen menschlichen Annotatoren mit hoher Wahrscheinlichkeit belohnt werden, treten sie immer häufiger auf.

Infolgedessen können einige dieser überstrapazierten Phrasen eher als Merkmal bestimmter Modelle, Architekturen und Trainingsprozesse angesehen werden und nicht nur als Kennzeichen des KI-Schreibens an sich. Eine Studie von Jenna Russell, Marzena Karpinska und Mohit Iyyer von der University of Maryland zeigt, dass verschiedene Modelle tatsächlich unterschiedliche bevorzugte Phrasen haben:

überbeanspruchtüberbeansprucht

Dies deutet darauf hin, dass verschiedene Modelle, die mit unterschiedlichen Datensätzen und Optimierungsstrategien trainiert wurden, ihre eigenen spezifischen Tendenzen bei der Phrasenwiederholung entwickeln können.

Bonus: Die beliebtesten N-Gramme unseres Teams

Im Rahmen unserer Arbeit hat unser Team unzählige Stunden damit verbracht, KI-generierte Texte zu lesen und zu analysieren. Natürlich haben wir eine Vorliebe für einige dieser Formulierungen entwickelt:

Hier sind die Lieblings-KI-Sätze unseres Teams:

  • Max (CEO): „In der sich ständig weiterentwickelnden“ (11.000x)

  • Bradley (CTO): „Wichtig zu beachten“ (3.000x)

  • Lu: (Gründungsingenieur): „komplexe Natur“ (6.000x)

  • Elyas (Gründungsingenieur): „lebendige Tapisserie“ (17.000x)


Elyas Masrour
Elyas MasrourGründungsingenieur

Elyas Masrour ist Gründungsingenieur bei Pangram. Seit er direkt nach seinem Abschluss an der University of Maryland als zweiter Mitarbeiter zu Pangram kam, hat er wichtige Infrastrukturkomponenten wie die Modell-Serving-API, rollenbasierte Zugriffskontrollen und unterstützende Evidenz-Pipelines aufgebaut. Elyas arbeitet zudem eng mit dem Forschungsteam an Projekten wie adversarialer Robustheit, Modellinterpretierbarkeit und der Erkennung heterogener gemischter Inhalte zusammen. Außerhalb der Arbeit genießt Elyas die vielfältigen Ausdrucksformen menschlicher Kreativität, darunter Filmemachen, Lesen und das Erkunden der Stadt.

Mehr von Elyas Masrour

Weiterführende Literatur

Wird Google im Jahr 2026 KI-generierte Inhalte benachteiligen?
Bildung

Wird Google im Jahr 2026 KI-generierte Inhalte benachteiligen?

30. Januar 2026
Der Stand der akademischen Integrität und KI-Erkennung 2025
Bildung

Der Stand der akademischen Integrität und KI-Erkennung 2025

4. Dezember 2025
Wie man KI-Texte erkennt
Bildung

Wie man KI-Texte erkennt

17. Juni 2024
Alles über Fehlalarme bei KI-Detektoren
Bildung

Alles über Fehlalarme bei KI-Detektoren

27. März 2025
KI-Prüfprogramme für Lehrer: Warum Schulen KI-Erkennungswerkzeuge benötigen
Bildung

KI-Prüfprogramme für Lehrer: Warum Schulen KI-Erkennungswerkzeuge benötigen

4. Februar 2025
Welchen KI-Detektor sollten Hochschulen einsetzen? Der akademische Standard 2026
Bildung

Welchen KI-Detektor sollten Hochschulen einsetzen? Der akademische Standard 2026

11. Mai 2026