Wir geben eine neue Partnerschaft mit Proofig bekannt! Weitere Informationen

Die Nachrichtenbranche ist ein 150-Milliarden-Dollar-Geschäft, in dem Tausende von Reportern und Journalisten beschäftigt sind, um Nachrichtenartikel zu schreiben, die Milliarden von Aufrufen erhalten. Mit KI und dem Aufkommen großer Sprachmodelle haben sich viele minderwertige Nachrichtenseiten und einige schlechte Akteure auf KI verlassen, um Inhalte kostengünstig, schnell und in großem Umfang zu generieren. Da KI die Rolle eines Journalisten nicht ersetzen kann, beschränken sich diese Nachrichtenseiten darauf, Informationen aus ihrem Training zu wiederholen oder Artikel anderer Medien zu stehlen und umzuformulieren.
Es hat sich auch gezeigt, dass unechte Inhalte weniger begehrt sind und von Online-Nutzern weniger häufig aufgerufen werden. In einem kürzlich veröffentlichten Blogbeitrag haben wir eine Studie von NP Digital zitiert, die eindeutig zu dem Ergebnis kam, dass Online-Leser von Menschen verfasste Artikel bevorzugen und ihnen Vorrang einräumen. Im Einzelnen:
Diese KI-Publikationen dienen in erster Linie dazu, Traffic und potenzielle Werbeeinnahmen von authentischen Nachrichteninhalten abzuziehen, und sind Teil einer wachsenden Content-Farming-Operation, die im Jahr 2023 21 % der Werbeeinblendungen und mehr als 10 Milliarden US-Dollar einnahm.
Da wir uns der Gefahr und der potenziellen Schäden bewusst waren, die durch diese Zunahme unechter Nachrichten entstehen, wollten wir das tatsächliche Ausmaß dieses Problems quantifizieren. Wir haben in Zusammenarbeit mit NewsCatcher eine Stichprobe der weltweit veröffentlichten Nachrichten eines bestimmten Tages klassifiziert.
Wir begannen damit, zunächst alle Nachrichten aus aller Welt zusammenzustellen, die am 1. Juli 2024 veröffentlicht wurden.
Die API von NewsCatcher ist die umfassendste Quelle für täglich veröffentlichte globale Nachrichtenartikel mit über 75.000 Quellen und bedient große Unternehmensorganisationen. Dank ihrer Technologie konnten wir den vollständigen Text von Artikeln aus aller Welt abfragen – in verschiedenen Sprachen verfasst und mit einem breiten Spektrum an Themen.
Mit NewsCatcher haben wir alle an einem Tag veröffentlichten Nachrichten gesammelt. Aus diesem Datenbestand haben wir 857.434 Artikel von 26.675 Online-Verlagen analysiert, die wir als repräsentativen Ausschnitt der täglich veröffentlichten Nachrichten betrachten.
Nachdem wir die Artikel beschafft hatten, führten wir unseren Pangram Text-Klassifikator aus, um festzustellen, welche Artikel von KI generiert wurden. Pangram Text ist branchenführend in Bezug auf die Klassifizierungsgenauigkeit (über 30-mal genauer als die nächstbeste kommerzielle Lösung) und legt großen Wert auf eine geringe Falsch-Positiv-Rate. In unserem technischen Bericht zeigen wir, dass unsere Falsch-Positiv-Rate bei Nachrichten nur 0,001 % beträgt, sodass wir sicher sein können, dass es sich bei den von uns als KI identifizierten Nachrichten tatsächlich um solche handelt. Unsere Lösung nimmt in der Regel ein Dokument oder einen Text entgegen und gibt eine Vorhersage über die Wahrscheinlichkeit zurück, dass dieser von einem LLM generiert wurde. Bei einer Webseite müssten wir einige Nachbearbeitungen und Bereinigungen des Seiteninhalts vornehmen, um nur den Artikeltext zu isolieren, aber mit der NewsCatcher-Lösung konnten wir den bereinigten Text direkt extrahieren und mit unserem Textklassifikator eine Inferenz durchführen.
Verteilung unserer Vorhersagen auf einer logarithmischen Skala. Wir verwenden eine logarithmische Skala, um zu zeigen, dass Vorhersagen nahe 0 oder 1 100-1000 Mal häufiger sind als Vorhersagen in der Mitte des Spektrums.
Anschließend haben wir die Verlage anhand der Gesamtzahl ihrer Artikel kategorisiert und sie nach einer Aufschlüsselung ihrer gesamten KI-Inhalte in Gruppen eingeteilt. Das Gruppierungsschema sieht wie folgt aus:
Von allen untersuchten Artikeln haben wir Folgendes festgestellt:
59.653 Artikel wurden als KI klassifiziert, was 6,96 % der gesamten Artikelmenge entspricht.
Verlage, sortiert nach der Menge der von ihnen veröffentlichten KI-Inhalte
Anschließend haben wir die KI-Klassifizierungen anhand wichtiger Merkmale untersucht, darunter die Sprache, in der der Artikel verfasst wurde, das Land, in dem der Artikel veröffentlicht wurde, das Thema, das der Artikel behandelte, sowie die besondere politische Relevanz.
Grafik zu KI-Artikeln nach Ländern (Prozentanteil der gesamten Nachrichtenartikel pro Land)
Wir stellen generell fest, dass Ghana in Bezug auf KI-generierte Inhalte eine ziemliche Ausnahme darstellt. Obwohl die Gesamtfrequenz geringer ist, ist auch Indien ein bedeutender Herausgeber von KI-generierten Inhalten, was angesichts der Auswirkungen von Deepfakes auf die jüngsten Wahlen in Indien.
Grafik der nach Themen geordneten KI-Artikel (Prozentanteil der insgesamt zu jedem Thema verfassten Nachrichtenartikel)
Wir stellen fest, dass Schönheit (gesponserte Artikel), Technologie und Wirtschaft (Krypto-Betrug) besonders große Themen sind, über die Menschen KI-Artikel schreiben. Etwas überraschend ist, dass Politik in KI-Artikeln tendenziell unterdurchschnittlich vertreten ist: Wir glauben, dass dies daran liegt, dass Werbetreibende aufgrund von Risiken für die Markensicherheit politische Nachrichtenseiten eher meiden, was den Anreiz für Verlage verringert, politische Inhalte für Werbezwecke zu produzieren.
Wir unterscheiden mehrere Kategorien von KI-Nachrichtenartikeln: Websites, die ausschließlich zu Werbezwecken erstellt wurden (MFAs), gesponserte Artikel, Betrug und Desinformation.
Eine Website, deren einziger Zweck darin besteht, Werbung zu schalten, anstatt legitime Inhalte bereitzustellen, wird als „MFA” bezeichnet – eine Website, die ausschließlich für Werbezwecke erstellt wurde. Hier ist ein Beispiel für eine MFA:

Für Werbung konzipierte Website voller Anzeigen
Wie wir sehen können, gibt es oberhalb der Falz der Website außer dem Titel keinen tatsächlichen Inhalt, und es gibt 8 Display-Anzeigen, die um die Aufmerksamkeit des Benutzers buhlen. Der KI-Inhalt darunter ist nicht wirklich zum Lesen gedacht: Er dient lediglich dazu, Besucher auf die Website zu locken, um Werbeeinnahmen zu generieren, bevor die Benutzer in der Regel sofort wieder abspringen. Werbetreibende sind sich oft gar nicht bewusst, dass sie auf diesen Websites werben: Aufgrund der programmatischen Natur der digitalen Werbung werden Gebote für diese Werbeflächen innerhalb von Millisekunden mithilfe automatisierter Gebotsalgorithmen gekauft und verkauft. Unternehmen wie Jounce Media helfen Werbetreibenden dabei, ihr Budget nicht für Websites wie diese zu verschwenden, und gehören zu einer Gruppe von Unternehmen, die als „Supply Chain Optimizers” bezeichnet werden.
Jounce definiert drei wesentliche Merkmale einer MFA:
Zusammenfassend lässt sich sagen, dass MFAs Websites mit legitimen Inhalten Werbetraffic stehlen, um günstig Werbeflächen anbieten zu können. Sie liefern programmatischen Werbekampagnen oberflächliche Kennzahlen, ohne tatsächlich nützliche Inhalte oder einen tatsächlichen ROI für Werbetreibende zu bieten. Sie verschmutzen das Internet und sorgen für eine unangenehme Nutzererfahrung für den durchschnittlichen Internetnutzer.
Es gibt zwar keine konkrete Messgröße dafür, was eine MFA definiert, aber wir schätzen, dass MFAs etwa 50 % der KI-generierten Online-Inhalte ausmachen.
Einige Nachrichten im Internet können gekauft werden, um für ein Produkt zu werben, wobei sie als tatsächliche Inhalte getarnt sind, die von einem Influencer oder einer seriösen Rezensionspublikation verfasst wurden. Wir haben festgestellt, dass Schönheit eines der Themen mit der höchsten Häufigkeit von KI-generierten Inhalten ist. Als wir uns die Daten genauer angesehen haben, stellten wir fest, dass viele der „Nachrichtenartikel” zum Thema Schönheit einfach gesponserte Artikel wie dieser sind:

KI hat diesen minderwertigen gesponserten Inhalt verfasst.
Viele Texter greifen einfach auf KI zurück, um diese minderwertigen gesponserten Artikel zu schreiben, da das Ziel lediglich darin besteht, die Platzierung zu verkaufen, anstatt eine authentische Bewertung zu erstellen.
Krypto-Betrüger nutzen KI, um Inhalte mit hoher Geschwindigkeit zu verbreiten.
Wir stellen fest, dass auch viele gewöhnliche Betrugskampagnen mit KI generiert werden. Insbesondere Krypto-Betrug scheint sehr verbreitet zu sein und wird sogar auf seriösen Websites wie Medium beworben.
Eine Desinformationsseite mit KI-Inhalten
Während wir feststellen, dass der Einsatz von KI in politischen Nachrichten in der Regel weniger verbreitet ist (was zum großen Teil darauf zurückzuführen ist, dass viele Werbetreibende politische Nachrichten aufgrund des Risikos für die Markensicherheit eher meiden), spielt KI eine immer größere Rolle in Desinformationskampagnen. Newsguard verfügt über ein KI-Tracking-Center, das detaillierte und aktuelle Informationen zu KI-gestützter Desinformation liefert.
Im Gegensatz zu anderen Formen der Täuschung, bei denen schlechte Akteure KI einsetzen, geht es bei diesen Artikeln tatsächlich darum, Menschen dazu zu bringen, den Inhalt zu lesen. In der Regel besteht der Zweck dieser Kampagnen darin, die öffentliche Meinung oder Einstellung zu einem bestimmten Thema zu verändern.
Da die US-Wahlen im November näher rücken, ist davon auszugehen, dass diese Art des Missbrauchs von KI weitergehen wird.
Möchten Sie mehr über unsere Karte mit KI-Inhalten im Internet oder unsere KI-Blockliste für Werbetreibende erfahren? Kontaktieren Sie uns unter info@pangram.com!
