Twitter, LinkedIn, Substack ve diğer platformlarda hangi içeriklerin insan, hangilerinin yapay zeka tarafından oluşturulduğunu anında öğrenin. Yeni Chrome uzantımızı indirin.
Claude Mythos Preview gibi güçlü öncü modeller karşısında bile yapay zeka tespitinin geçerliliğini koruyacağına inanıyoruz.
İster insan ister büyük dil modeli (LLM) olsun, herhangi bir yazar bir metin yazarken kararlar alır. 150 kelimelik bir metin içinde bile yazar, kelime seçimi, kelime sırası, noktalama işaretlerinin yerleştirilmesi ve cümle yapısı konusunda yüz binlerce bilinçli ve bilinçsiz karar verebilir.
Temelde, yapay zeka ile algılama, yazar tanımlama sorunudur. Belirli bir model ne kadar gelişmiş olursa olsun, kararları veren yine tek bir yazardır. Bu kararlar ayrıca kısıtlamalara tabidir: yardımcı modellerin yararlı, açık ve okunabilir metinler üretmesi gerekir. Bu özellikler, denetimli ince ayar ve pekiştirmeli öğrenme yoluyla modele kazınır.

En gelişmiş sınır modeli bile yine de tek bir yapılandırılmış sistemdir ve belirgin alışkanlıkları ve tuhaflıkları olacaktır. Bu modeller ayrıca çok fazla metin üretir; bu da, bu modellerin ne tür kararlar almaya meyilli olduklarını öğrenmek için elimizde pek çok fırsat olduğu anlamına gelir.
İnsanlar bazen sorunu sanki "insan ve yapay zeka tarafından yazılan metinler arasındaki istatistiksel fark azalıyor"muş gibi sunuyor. Bu, algılama işleminin nasıl çalıştığına dair yanlış bir tanımlamadır . Viral olan NYT testinde gördüğümüz gibi, yapay zeka halihazırda eğitimsiz bir gözün insan yazısı olarak algılayacağı kadar iyi yazmaktadır . Ancak bir model tarafından üretilen yazılar, herhangi bir tek yazarın çıktıları gibi, her zaman gömme uzayında birbirine yakın kümelenecektir. Bu nedenle, modeller giderek daha güçlü hale gelse bile, yapay zeka algılamasının geçerliliğini koruyacağına inanıyoruz.
Sonuçlar umut verici görünüyor. Mevcut Pangram modeli, sistem kartında yayınlanan Mythos Preview kısa öyküsünü doğru bir şekilde tespit edebildi.
Modeller eğitilmiş sistemler olduğu sürece, algılamanın çözülebilir bir sorun olarak kalacağına inanıyoruz.
