Wir geben eine neue Partnerschaft mit Proofig bekannt! Weitere Informationen
Unser Klassifikator verwendet eine traditionelle Sprachmodellarchitektur. Er empfängt den Eingabetext und tokenisiert ihn. Anschließend wandelt das Modell jedes Token in eine Einbettung um, bei der es sich um einen Vektor aus Zahlen handelt, der die Bedeutung jedes Tokens darstellt.
Die Eingabe wird durch das neuronale Netzwerk geleitet und erzeugt eine Ausgabe-Einbettung. Ein Klassifikator-Kopf wandelt die Ausgabe-Einbettung in eine 0- oder 1-Vorhersage um, wobei 0 die menschliche Bezeichnung und 1 die KI-Bezeichnung ist.
Das ursprüngliche Modell war bereits recht effektiv, aber wir wollten die Genauigkeit maximieren und die Möglichkeit von Fehlalarmen (falsche Vorhersagen, dass von Menschen verfasste Dokumente von KI generiert wurden) reduzieren. Zu diesem Zweck haben wir einen Algorithmus speziell für KI-Erkennungsmodelle entwickelt.
Mit dem ursprünglichen Datensatz verfügte unser Modell nicht über genügend Signale, um von einer Genauigkeit von 99 % auf 99,999 % zu kommen. Das Modell lernt zwar schnell die anfänglichen Muster in den Daten, muss jedoch auch schwierige Grenzfälle erkennen, um präzise zwischen von Menschen verfassten Texten und KI-Texten unterscheiden zu können.
Wir lösen dieses Problem, indem wir das Modell zur Suche nach Fehlalarmen in großen Datensätzen einsetzen und den ursprünglichen Trainingssatz vor dem erneuten Training um diese zusätzlichen schwierigen Beispiele ergänzen. Nach mehreren Durchläufen weist das resultierende Modell eine Fehlalarmquote von nahezu Null sowie eine insgesamt verbesserte Leistung bei den zurückbehaltenen Bewertungssätzen auf.
