Proofig ile yeni bir ortaklık duyurusu! Daha fazla bilgi edinin
TLDR; Akademisyenler ve içerik moderatörleri, AI tespit araçları veya AI denetleyicileri hakkındaki değerlendirmelerini yeniden gözden geçirmelidir. 2023 yılında akademik makaleler ve popüler medya tarafından oluşturulan önceki konsensüs artık geçerliliğini yitirmiştir. Pangram gibi en yeni AI tespit modelleri, en yeni LLM'leri yakalamakla kalmamış, aynı zamanda geleceğe dönük olarak da geliştirilmektedir.
ChatGPT 2022'de piyasaya sürüldüğünde, yazarlar ve içerik oluşturucular yeni yapay zeka aracını kullanmak için akın etti. O günden beri bu akın devam ediyor. Yaratıcılar, ChatGPT'yi (ve diğer AI modellerini) ve rakiplerini, araştırma makaleleri ve romanlar gibi büyük belgelerden e-postalar, Reddit yorumları ve Amazon incelemeleri gibi küçük parçalara kadar her şeyi yazmak için kullandılar. AI tarafından oluşturulan içerikler interneti doldurdu. Ancak, LLM'lerin ortaya çıkmasından bu yana, insan tarafından yazılanlarla yapay zeka tarafından yazılanları ayırma talebi ortaya çıktı. OpenAI bu ihtiyacı fark etti ve metinleri yapay zeka olarak sınıflandıran bir ürün geliştirdi. Yapay zekanın benimsenmesi arttıkça, özellikle akademik dürüstlüğün çok önemli olduğu okullarda ve üniversitelerde yapay zeka dedektörleri veya sınıflandırıcılarına olan talep arttı. Bazı öğrenciler (genellikle erken benimseyenler) ödevlerini bitirmek, sınavlara girmek ve üniversiteye başvurmak için en son modelleri kullandılar. Bazı araştırmacılar, zaman baskısı altında, köşeleri kesip AI tarafından yazılmış veya desteklenmiş çalışmaları yayınlar için sundular. Bu nedenle, bu endişeleri gidermek umuduyla birçok araç piyasaya sürüldü. TurnItIn gibi akademik yazılım şirketleri, mevcut eğitim müşterilerine hizmet vermek için Nisan 2023'te AI Checker adlı bir araç piyasaya sürdü. Grammarly de 2024'te Grammarly Authorship adlı kendi aracını piyasaya sürdü. Bu şirketlerin hakim düşüncesi, araçlarının intihal tespit edebiliyorsa, yapay zekayı da tespit edebilmesi gerektiğiydi. Özellikle yükseköğretim, "intihal denetleyicilerinden" "yapay zeka denetleyicilerine" geçiş yapmalıydı. Ancak, bunun işe yaramayacağı başından beri açıktı.
Erken dönem AI dedektörleri, perplexity ve burstiness kavramlarını kullanarak doğruluk vaat ediyordu. Pangram'ın CTO'su Bradley Emi bu terimleri şöyle açıklıyor: "Perplexity, bir metindeki her kelimenin ne kadar beklenmedik veya şaşırtıcı olduğunu ifade eder. Burstiness ise bir belge boyunca perplexity'deki değişimi ifade eder. Belge boyunca şaşırtıcı kelime ve ifadeler serpiştirilmişse, o belgenin burstiness değeri yüksektir."
Bu terimlere takılmayacağız, ancak bir AI algılama aracı oluştururken bu faktörlere çok fazla güvenmek üç tutarlı kusura yol açar:
Bunlar özellikle akademik kurumlar için gerçek endişelerdir. Öğrencileri ve araştırmacıları çalışmalarında ve makalelerinde AI kullandıkları için haksız yere suçlamanın ağırlığı çok büyüktür. Bu, kariyerleri mahvedebilir. AI'yı filtrelemek için %95 etkinlik oranına sahip araçlara güvenmek bile inanılmaz derecede risklidir. Bu nedenle, MIT, Vanderbilt ve UC Berkeley gibi birçok önde gelen akademik kurum, öğretmenlerinin AI dedektörlerini kullanmasını desteklememektedir. Çoğu durumda, AI dedektörlerinin ne kadar kötü performans gösterdiğini özetleyen " AI Tarafından Üretilen Metinler için Algılama Araçlarının Test Edilmesi" gibi belirli araştırma makalelerini ve " AI yazma dedektörleri neden işe yaramıyor?" gibi endüstri makalelerini örnek olarak göstermişlerdir.
OpenAI bu sorunları o kadar zor buldu ki , Temmuz 2023'te "AI sınıflandırıcı, düşük doğruluk oranı nedeniyle artık kullanılamıyor" gerekçesiyle AI Metin Sınıflandırıcısını terk etti. Birçok okul yöneticisi şu sonuca vardı: OpenAI bunu yapamıyorsa, muhtemelen imkansızdır.
En iyi üniversiteler ve genel kamuoyu, yapay zeka algılamanın imkansız ya da hatta sahte bir vaat olduğu konusunda fikir birliğine varırken, Pangram Labs gibi şirketler bu alanda önemli gelişmeler sağlayarak yapay zeka algılamayı üniversite ve kurumsal ortamlarda önemli bir araç haline getirdi.
AI tespiti, genellikle kısa yollar arayan öğrenciler ile insan tarafından yazılmış olanları ve olmayanları ayırmak isteyen eğitimciler arasındaki bir silahlanma yarışı olarak adlandırılır. 2025 yılında, tespit cihazları çıtayı yükseltti.
2025 yılının Ağustos ayında, Chicago Booth'tan iki araştırmacı olan Brian Jabarian ve Alex Emi, Yapay Yazım ve Otomatik Algılamaadlı bir makale yayınladılar ve "çoğu ticari AI dedektörünün oldukça iyi performans gösterdiğini, özellikle Pangram'ın yanlış pozitif oranları ve yanlış negatif oranları neredeyse sıfıra yakın olduğunu" belirttiler. Pangram'ı "AI metinlerini doğru bir şekilde algılama yeteneğinden ödün vermeden sıkı bir politika sınırını (yanlış pozitif oranları ≤ 0,005) karşılayan tek dedektör" olarak nitelendirdiler. Bu, yapay zeka tespitinin birkaç yıl içinde ne kadar ilerlediğinin bir örneğidir. Peki bu nasıl oldu?
İlk olarak, AI araştırmacıları daha geniş bir yelpazede insan metinleri ve AI tarafından üretilen metinler toplayarak veri setlerini iyileştirdiler. Bu, akademik makalelerin yanı sıra e-postalar ve makaleler gibi diğer yazıları da içeriyor. İkinci olarak, geliştiriciler yanlış pozitif oranlarını azaltmak için aktif öğrenmeyi kullandılar. Bu, AI veya insan olarak sınıflandırılması en zor metinleri bulup, bunları modellerine yeniden entegre ettikleri anlamına geliyor.
Ve silahlanma yarışında, Gen AI yaratıcıları bazı AI dedektörlerini kırmak için yeterince yanıt vermediler. OpenAI'nin çok konuşulan GPT-5 piyasaya sürüldüğünde, halüsinasyonların azalması, tonun iyileştirilmesi ve daha yaratıcı yazım vaat ediyordu. 12 saat içinde, Pangram Labs'ın kurucu ortağı Max Spero, LinkedIn'de Pangram'ın AI algılama aracının herhangi bir ek eğitim olmadan GPT-5 testlerini önceki modellerle benzer bir oranda sınıflandırabildiğini belirten bir gönderi paylaştı:
"Pangram, GPT-5'i açıkça eğitilmeden güvenilir bir şekilde tespit edebilen tek yapay zeka dedektörüdür."
AI dedektörlerinin kullanımına ilişkin gerçek endişeler var. Birçoğu hala endişe verici yanlış pozitif oranlarına sahip ve doğruluklarını yanlış bir şekilde tanıtıyor. Ancak, en son teknolojilerin bazıları inanılmaz derecede güvenilir ve kurumsal işletmelere ve üniversitelere aktif olarak entegre ediliyor. Örneğin, uzman kaynak bulma şirketi Qwoted, "uzmanlar" tarafından AI ile yazılmış alıntıları azaltmak için yakın zamanda AI algılamayı iş akışına entegre etti. "Gazeteciliğin geleceği güvene bağlıdır. Bu nedenle, AI algılama ve atıfta altın standardı belirleyen Pangram ile ortaklık kurmaktan büyük mutluluk duyuyoruz."
Araştırmacılar ve gazeteciler de bu akıma katılıyor. Uzun süredir eleştiri yapanlar ön yargılarını değiştiriyor ve AI tespitini daha geniş bir AI politikasına dahil etmenin yollarını araştırıyor. Press Gazette'den Rob Waugh, AI tarafından üretilen yazıları tespit etmek isteyen kullanıcılara Pangram'ı önerdi. "Bu tür araçlar %100 güvenilir değildir, ancak Pangram diğer çevrimiçi AI denetleyicilerine kıyasla doğru olarak değerlendirilmiştir ve AI tarafından üretilen sunumları ve metinleri tespit etmek için Qwoted gibi gazeteci yanıt hizmetlerine entegre edilmiştir."
Kullanım durumunuzu ve Pangram'ın kuruluşunuz için değerli olup olmayacağını tartışmak istiyoruz. Bizi deneyin ve kurumsal tekliflerimiz hakkında bizimle iletişime geçin.
