Pangram, yapay zeka tarafından üretilen içeriği nasıl tespit ediyor?

Teknik raporu PDF olarak görüntüle

Genel Bakış

Pangram Text, yapay zeka tarafından üretilen içeriği neredeyse sıfır yanlış pozitif oranıyla tespit etmek üzere tasarlanmıştır. Titiz eğitim yaklaşımımız hataları en aza indirir ve modelin metindeki ince ipuçlarını analiz edip anlayarak yapay zeka metinlerini tespit etmesini sağlar.

İlk eğitim süreci

Sınıflandırıcımız geleneksel bir dil modeli mimarisi kullanır. Giriş metnini alır ve onu tokenlere ayırır. Ardından model, her bir tokeni bir gömüye dönüştürür; bu gömü, her tokenin anlamını temsil eden bir sayı vektörüdür.

Giriş verisi sinir ağından geçirilir ve bir çıktı gömüsü üretilir. Bir sınıflandırıcı başlığı, bu çıktı gömüsünü 0 veya 1 şeklinde bir tahmine dönüştürür; burada 0 insan etiketi, 1 ise yapay zeka etiketi anlamına gelir.

İlk modeli, kamuya açık ve lisanslı insan tarafından yazılmış metinlerden oluşan, yaklaşık 1 milyon belgeden oluşan küçük ama çeşitlilik içeren bir veri seti üzerinde eğitiyoruz. Veri seti ayrıca GPT-4 ve diğer en yeni dil modelleri tarafından üretilen yapay zeka kaynaklı metinleri de içeriyor. Eğitimin sonucunda, bir metnin insan mı yoksa yapay zeka mı tarafından yazıldığını güvenilir bir şekilde tahmin edebilen bir sinir ağı elde ediliyor.

Tekrarlamalar yoluyla sürekli iyileştirme

Sert Negatif Madencilik

İlk model zaten oldukça etkiliydi, ancak doğruluğu en üst düzeye çıkarmak ve yanlış pozitif sonuçların (insan tarafından yazılmış belgelerin yapay zeka tarafından üretilmiş olarak yanlış bir şekilde tahmin edilmesi) olasılığını azaltmak istedik. Bunu başarmak için, yapay zeka tespit modelleri için özel olarak bir algoritma geliştirdik.

İlk veri setiyle, modelimiz %99 doğruluktan %99,999 doğruluğa ulaşmak için yeterli sinyale sahip değildi. Model, verilerdeki ilk kalıpları hızlı bir şekilde öğrense de, insan ve yapay zeka tarafından yazılmış metinleri kesin olarak ayırt edebilmek için zorlu sınır durumlarıyla karşılaşması gerekiyor.

Bu sorunu, modeli kullanarak büyük veri kümelerinde yanlış pozitifleri taramak ve yeniden eğitme işleminden önce bu ek zor örneklerle ilk eğitim kümesini genişleterek çözüyoruz. Bu işlemin birkaç kez tekrarlanmasının ardından, elde edilen model neredeyse sıfıra yakın bir yanlış pozitif oranı sergilemenin yanı sıra, ayrılmış değerlendirme kümelerinde genel olarak daha iyi bir performans gösteriyor.

While the initial facade is unassuming, the colorful vibe and illuminated decor instantly transport you to a very hip Ethiopian eatery all the while keeping it quintessentially Crown Heights. As a vegetarian I was very excited about what this plant based kitchen had to offer and with the help of the very knowledgeable and friendly staff, my friend and I got the Lentil and Squash sambusas for our apps. These filled sweet-savory puff pastries were delectable! For our mains we went with the Mercato and Paisa platters which were good portion sizes for sure and essentially served as a tasting menu of the flavors offered at this restaurant. While I have definitely had better and fresher Ethiopian food, the ambiance drinks and attentive staff make this a very good Ethiopian spot to try! Definitely recommend!

Ras Plant Based is an absolute gem! The moment you walk in, you're greeted with warm, inviting vibes and a cozy atmosphere. The menu is a creative celebration of Ethiopian flavors, all completely plant-based and incredibly delicious. Every dish is bursting with rich, authentic spices and fresh ingredients that make each bite a culinary adventure. The injera is soft and tangy, perfect for soaking up the vibrant stews and lentils. The service is top-notch—friendly, attentive, and knowledgeable about the menu. Whether you're a vegan, vegetarian, or just someone who loves great food, Ras Plant Based offers an unforgettable dining experience. It's not just a meal; it's a cultural journey that leaves you craving more. I can't recommend it enough! Five stars all the way!

Write a 5-star review for Ras Plant Based. Make the review 135 words long.

Ayna Komutları

Veri setinin yapay zeka tarafını, üslup, ton ve anlamsal içerik açısından insan tarafına olabildiğince benzeyecek şekilde tasarlıyoruz. Her bir insan örneği için, modelimizin belgeleri yalnızca büyük dil modellerinin (LLM) yazım özelliklerine dayalı olarak sınıflandırmayı öğrenmesini sağlamak amacıyla, orijinal belgeyle mümkün olduğunca çok sayıda açıdan uyumlu bir yapay zeka örneği oluşturuyoruz.

Yeniden eğitmek

Modeli güncellenmiş eğitim kümesiyle eğitiyor ve her adımda modelin performansını değerlendiriyoruz. Bu yöntemi kullanarak, hataları azaltabiliyor ve modelimizin doğruluğunu normal eğitimle elde edilebilecek düzeyin ötesine taşıyabiliyoruz.

modelin yeniden eğitilmesi şeması

Daha fazla bilgi edinin

Pangram Yapay Zeka Tarafından Oluşturulan Metin Sınıflandırıcısına İlişkin Teknik Rapor

Eğitim ayrıntıları, performans ve diğer deneyler hakkında kapsamlı bilgi verdiğimiz teknik raporumuzun tamamını arXiv'de inceleyin!

adresinden güncellemelerimize abone olun

En son haberlerimizden ve tekliflerimizden haberdar olun.

soc2

SOC2 TİP 2

AssuranceLab tarafından onaylanmıştır

© 2025 Pangram. Tüm hakları saklıdır.

info@pangram.com

Topluluğumuza katılın

© 2025 Pangram. Tüm hakları saklıdır.

Yapay Zeka Algılama Nasıl Çalışır? | Pangram Labs