Proofig ile yeni bir ortaklık duyurusu! Daha fazla bilgi edinin

Habercilik, milyarlarca kez görüntülenen haber makaleleri yazmak için binlerce muhabir ve gazeteciyi istihdam eden 150 milyar dolarlık bir sektördür. Yapay zeka ve büyük dil modellerinin yükselişiyle birlikte, birçok düşük kaliteli haber sitesi ve bazı kötü niyetli aktörler, içeriği ucuz, hızlı ve büyük ölçekte üretmek için yapay zekaya güvenmeye başladı. Yapay zeka bir gazetecinin rolünü yerine getiremediğinden, bu haber siteleri eğitimlerinden edindikleri bilgileri tekrarlamakla veya diğer yayınların makalelerini çalmak ve yeniden ifade etmekle sınırlı kalmaktadır.
Sahte içeriklerin, çevrimiçi izleyiciler tarafından daha az tercih edildiği ve daha az ziyaret edildiği de kanıtlanmıştır. Yakın zamanda yayınlanan bir blog yazısında, NP Digital tarafından yapılan ve çevrimiçi okuyucuların insan tarafından yazılmış makaleleri tercih ettiklerini ve öncelik verdiklerini kesin olarak ortaya koyan bir araştırmaya atıfta bulunduk. Spesifik olarak:
Bu AI yayınları, esas olarak gerçek haber içeriklerinden trafik ve potansiyel reklam gelirlerini çekmek için varlar ve geçen yıl 2023'te reklam gösterimlerinin %21'ini ve 10 milyar dolardan fazla geliri ele geçiren, giderek büyüyen içerik çiftçiliği operasyonunun bir parçası olarak hizmet ediyorlar.
Bu sahte haberlerin yaygınlaşmasının yarattığı tehdidi ve potansiyel zararları bilerek, bu sorunun gerçek boyutunu ölçmek istedik. NewsCatcher ile işbirliği yaparak, belirli bir günde dünya çapında yayınlanan haberleri sınıflandırdık.
İlk olarak, 1 Temmuz 2024 tarihinde yayınlanan tüm dünya haberlerini bir araya getirdik.
NewsCatcher’ın API'si, 75.000'den fazla kaynağa sahip ve büyük kurumsal organizasyonlara hizmet veren, günlük olarak yayınlanan küresel haber makalelerinin en kapsamlı kaynağıdır. Onların teknolojisi, farklı dillerde yazılmış ve geniş bir konu yelpazesini kapsayan, dünyanın dört bir yanından yayınlanan makalelerin tam metnini sorgulamamıza olanak tanıdı.
NewsCatcher'ı kullanarak, bir gün içinde yayınlanan tüm haberleri topladık; bu veri yığınından, 26.675 çevrimiçi yayıncıdan toplanan 857.434 makaleyi analiz ettik ve bunu günlük yayınlanan haberlerin temsil edici bir kümesi olarak kabul ettik.
Makaleleri temin ettikten sonra, Pangram Text sınıflandırıcıyı çalıştırarak hangi makalelerin AI tarafından üretildiğini belirledik. Pangram Text, sınıflandırma doğruluğu konusunda sektör lideridir (bir sonraki önde gelen ticari çözümden 30 kat daha doğrudur) ve düşük yanlış pozitif vakalarına karşı güçlü bir taahhüdü vardır. Teknik raporumuzda, haberlerdeki yanlış pozitif oranımızın yalnızca %0,001 olduğunu gösteriyoruz, bu da haberleri AI olarak tahmin ederken bunun gerçekten doğru olduğuna güvenmemizi sağlıyor. Çözümümüz genellikle bir belgeyi veya metni alır ve bunun bir LLM tarafından üretilme olasılığını tahmin eder. Bir web sayfası için, yalnızca makale metnini ayırmak için sayfanın içeriğini sonradan işleme tabi tutmalı ve temizlemeliyiz, ancak NewsCatcher çözümünü kullanarak temizlenmiş metni doğrudan çekebildik ve metin sınıflandırıcımızla çıkarımda bulunabildik.
Tahminlerimizin logaritmik ölçekte dağılımı. Logaritmik ölçek kullanarak, 0 veya 1'e yakın tahminlerin, spektrumun ortasındaki tahminlerden 100-1000 kat daha yaygın olduğunu gösteriyoruz.
Ardından yayıncıları, toplam makale sayılarının toplamı olarak sınıflandırdık ve toplam AI içeriğinin dağılımına göre gruplara ayırdık. Gruplandırma çerçevesi şu şekildedir:
Örneklemdeki toplam makalelerden şunu tespit ettik:
59.653 makale AI olarak sınıflandırıldı ve bu, makale setinin %6,96'sını temsil ediyor.
Yayıncılar, yayınladıkları AI içeriğinin miktarına göre sıralanmıştır.
Ardından, makalenin yazıldığı dil, makalenin yayınlandığı ülke, makalenin ele aldığı konu ve özel siyasi önemi gibi temel özellikler üzerinden AI sınıflandırmalarını inceledik.
Ülkelere göre üretilen AI makalelerinin grafiği (ülkelere göre yazılan toplam haber makalelerinin yüzdesi)
Genel olarak, Gana'nın yapay zeka tarafından üretilen içerik açısından oldukça güçlü bir istisna olduğunu görüyoruz. Genel sıklık daha düşük olsa da, Hindistan da yapay zeka tarafından üretilen içeriğin önemli bir yayıncısıdır, bu da göz önüne alındığında şaşırtıcı olmamalıdır. deepfake'lerin son Hindistan seçimleri üzerindeki etkisi.
Konuya göre üretilen AI makalelerinin grafiği (her konu hakkında yazılan toplam haber makalelerinin yüzdesi)
Güzellik (sponsorlu makaleler), teknoloji ve iş dünyası (kripto dolandırıcılığı) konularının, insanların AI makaleleri yazdığı özellikle geniş konular olduğunu fark ettik. Biraz şaşırtıcı bir şekilde, siyaset konusu AI makalelerinde ortalamanın altında kalıyor: Bunun nedeninin, reklamverenlerin marka güvenliği riskleri nedeniyle siyasi haber sitelerinden kaçınmaları ve yayıncıların reklam amaçlı siyasi içerik üretme motivasyonunu düşürmeleri olduğunu düşünüyoruz.
AI haber makalelerini birkaç kategoriye ayırıyoruz: reklam amaçlı siteler (MFA'lar), sponsorlu makaleler, dolandırıcılık ve dezenformasyon.
Meşru içerik sunmak yerine yalnızca reklam göstermeyi amaçlayan bir site, "MFA" (reklam amaçlı site) olarak adlandırılır. İşte bir MFA örneği:

Reklamlarla dolu, reklam amaçlı site
Gördüğümüz gibi, web sitesinin üst kısmında başlık dışında gerçek bir içerik bulunmuyor ve kullanıcının dikkatini çekmek için 8 adet görüntülü reklam yer alıyor. Aşağıdaki AI içeriği aslında okunmak için değil, kullanıcılar genellikle hemen sayfadan ayrılmadan önce siteye ziyaretçileri çekerek reklam gelirini artırmak için yerleştirilmiştir. Reklamverenler genellikle bu sitelerde reklam verdiklerinin farkında bile değildir: dijital reklamcılığın programatik yapısı, bu reklam alanları için tekliflerin otomatik teklif algoritmaları kullanılarak milisaniyeler içinde alınıp satıldığı anlamına gelir. Jounce Media gibi şirketler, reklamverenlerin bu tür sitelerde bütçelerini boşa harcamalarını önlemeye yardımcı olur ve "Tedarik Zinciri Optimize Ediciler" adlı bir şirketler grubunun parçasıdır.
Jounce, MFA'nın üç temel özelliğini şöyle tanımlar:
Özetlemek gerekirse, MFA'lar, reklam alanı arzını ucuza sunmak için meşru içeriğe sahip sitelerden reklam trafiğini çalarlar. Programatik reklam kampanyalarına gösterişli metrikler sunarken, reklamverenlere aslında hiçbir yararlı içerik veya gerçek ROI sağlamazlar. İnterneti kirletir ve ortalama internet tüketicisi için düşmanca bir kullanıcı deneyimi yaratırlar.
MFA'yı tanımlayan somut bir ölçüt olmasa da, MFA'ların çevrimiçi yapay zeka tarafından üretilen içeriğin yaklaşık %50'sini oluşturduğunu tahmin ediyoruz.
İnternetteki bazı haberler, bir ürünü tanıtmak için satın alınabilirken, influencerlar veya meşru inceleme yayınları tarafından yazılmış gerçek içerik gibi gösterilebilir. Güzellik konusunun, yapay zeka tarafından üretilen içeriğin en sık kullanıldığı konulardan biri olduğunu fark ettik. Verileri incelediğimizde, güzellik konusundaki "haber" makalelerinin çoğunun, bunun gibi sponsorlu makaleler olduğunu gördük:

AI bu düşük kaliteli sponsorlu içeriği yazdı.
Birçok metin yazarı, bu düşük kaliteli sponsorlu makaleleri yazmak için yapay zekayı kullanmaya başvuruyor, çünkü amaç, gerçek bir inceleme oluşturmak değil, sadece yerleştirmeyi satmak.
Kripto dolandırıcıları, yapay zeka kullanarak yüksek hızda içerik üretmektedir.
AI ile oluşturulan birçok sıradan dolandırıcılık kampanyası da görüyoruz. Özellikle kripto dolandırıcılığı çok yaygın görünüyor ve hatta Medium gibi saygın sitelerde bile tanıtılıyor.
AI içeriğiyle doldurulmuş bir dezenformasyon sitesi
Siyasi haberlerde AI kullanımının genellikle daha az yaygın olduğunu görsek de (bunun büyük bir kısmı, birçok reklamverenin marka güvenliği riski nedeniyle siyasi haberlerden kaçınma eğiliminde olmasından kaynaklanmaktadır), AI dezenformasyon kampanyalarının giderek artan bir bileşenidir. Newsguard, AI destekli dezenformasyonu ayrıntılı ve güncel olarak izleyen bir AI izleme merkezine sahiptir.
Kötü niyetli kişilerin yapay zekayı kullandıkları diğer aldatma biçimlerinden farklı olarak, bu makalelerin amacı aslında insanların içeriği okumasını sağlamaktır. Genellikle, bu kampanyaların amacı belirli bir konu hakkında kamuoyunun duygularını veya görüşlerini değiştirmektir.
Kasım ayında ABD seçimleri yaklaşırken, bu tür AI suistimallerinin devam edeceğini bekleyebiliriz.
Web'deki AI içeriği haritamız veya reklamverenler için AI engelleme listemiz hakkında daha fazla bilgi edinmek ister misiniz? info@pangram.com adresinden bize ulaşın!
