Question 1

What data did you train your model on?

Accepted Answer

Unser Modell wurde anhand eines vielfältigen, firmeneigenen Datensatzes mit Millionen von Dokumentenpaaren – bestehend aus von Menschen verfassten und von KI erstellten Texten – trainiert. Wir nutzen aktives Lernen, um Grenzfälle gezielt zu behandeln und Vorurteile gegenüber Autoren mit Englisch als Zweitsprache gezielt abzubauen.

Question 2

How do I interpret the API results?

Accepted Answer

Die API gibt einen Vorhersagewert (0,0 bis 1,0) und eine kategoriale Kennzeichnung zurück. Erweiterte Endpunkte bieten Analysen auf Fensterebene, um „Burstiness“ und Syntaxmuster im gesamten Dokument zu visualisieren.

Question 3

Are you storing data from API calls?

Accepted Answer

Nein. Für Unternehmenskunden bieten wir Garantien ohne Datenspeicherung an, bei denen die Daten im Arbeitsspeicher verarbeitet und unmittelbar nach der Auswertung gelöscht werden, um den Datenschutz zu gewährleisten.

Question 4

Can Pangram detect text from the latest AI models?

Accepted Answer

Ja. Wir trainieren unseren Klassifikator kontinuierlich mit den Ergebnissen neuer Spitzenmodelle (wie Gemini Ultra und GPT-4) – und zwar bereits wenige Tage nach deren Veröffentlichung.

Question 5

How does Pangram handle adversarial attacks or "humanized" text?

Accepted Answer

Unsere Modelle werden speziell auf adversarische Angriffe und „Humanizer“ trainiert, die versuchen, synthetischen Text zu verschleiern. Durch den Einsatz von „Hard Negative Mining“ während des Trainings minimieren wir Fehlalarme bei stilistisch formellen menschlichen Texten.

Question 6

Can I integrate this directly into my automated data pipelines?

Accepted Answer

Ja. Sie können das pangram-sdk installieren, um die Erkennung mit nur wenigen Zeilen Code in Airflow- oder Databricks-Pipelines zu integrieren. Unsere API ist für Scraping-Vorgänge in Unternehmen mit hohem Durchsatz optimiert und unterstützt Millionen von Anfragen bei geringer Latenz.

Question 7

How does Pangram distinguish between AI-generated content and human-edited "mixed" content?

Accepted Answer

Im Gegensatz zu binären Detektoren liefert Pangram Wahrscheinlichkeitswerte auf Token-Ebene. Dank dieser detaillierten Auswertbarkeit können Sie von Menschen bearbeitete Segmente identifizieren und beibehalten, während Sie vollständig synthetischen „Slop“ aus Ihren Trainingsdatensätzen herausfiltern.

Question 8

What is the primary benefit for LLM training and data selection?

Accepted Answer

Der Einsatz von Pangram hilft, einen Modellkollaps zu verhindern. Indem Sie rekursiv von KI generierte Inhalte aus Ihren Scraping-Pipelines herausfiltern, bewahren Sie die Reinheit Ihres Korpus und stellen sicher, dass Ihre Modelle nicht an Leistung oder Vielfalt einbüßen, weil sie auf fehlerhaften Daten trainiert werden.

KI-Detektor für ML-Ingenieure und Datenwissenschaftler

Trainieren Sie Ihre Modelle
nicht mit fehlerhaften Daten.

Modellkollaps verhindern

RLHF-Eingaben überprüfen

Detaillierte Interpretierbarkeit

Ein Modell, auf das Sie
vertrauen können

Hartes Negativ-Mining

Robustheit gegenüber Angriffen

Zukunftssicherung

Entwickelt für Ihre Datenpipeline bei „
“

Häufig gestellte Fragen zur KI-Erkennung

Mit welchen Daten haben Sie Ihr Modell trainiert?

Wie interpretiere ich die API-Ergebnisse?

Speichern Sie Daten aus API-Aufrufen?

Kann Pangram Texte aus den neuesten KI-Modellen erkennen?

Wie geht Pangram mit adversarialen Angriffen oder „humanisiertem“ Text um?

Kann ich das direkt in meine automatisierten Datenpipelines integrieren?

Wie unterscheidet Pangram zwischen KI-generierten Inhalten und von Menschen bearbeiteten „gemischten“ Inhalten?

Was ist der Hauptvorteil bei der LLM-Trainierung und der Datenauswahl?

KI-Erkennung für
jedes Unternehmens

Für Entwickler

Zur Inhaltsmoderation

Für Hochschulen

Bereinigen Sie noch heute Ihre Trainingsdaten