Proofig ile yeni bir ortaklık duyurusu! Daha fazla bilgi edinin

Her gün 60.000 adet yapay zeka tarafından üretilen haber makalesi yayınlanıyor.

Bradley Emi
5 Ağustos 2024

Genel Bakış

Habercilik, milyarlarca kez görüntülenen haber makaleleri yazmak için binlerce muhabir ve gazeteciyi istihdam eden 150 milyar dolarlık bir sektördür. Yapay zeka ve büyük dil modellerinin yükselişiyle birlikte, birçok düşük kaliteli haber sitesi ve bazı kötü niyetli aktörler, içeriği ucuz, hızlı ve büyük ölçekte üretmek için yapay zekaya güvenmeye başladı. Yapay zeka bir gazetecinin rolünü yerine getiremediğinden, bu haber siteleri eğitimlerinden edindikleri bilgileri tekrarlamakla veya diğer yayınların makalelerini çalmak ve yeniden ifade etmekle sınırlı kalmaktadır.

Sahte içeriklerin, çevrimiçi izleyiciler tarafından daha az tercih edildiği ve daha az ziyaret edildiği de kanıtlanmıştır. Yakın zamanda yayınlanan bir blog yazısında, NP Digital tarafından yapılan ve çevrimiçi okuyucuların insan tarafından yazılmış makaleleri tercih ettiklerini ve öncelik verdiklerini kesin olarak ortaya koyan bir araştırmaya atıfta bulunduk. Spesifik olarak:

  • Okuyucular, tamamen yapay zeka tarafından üretilen içeriğe kıyasla, insanlar tarafından yazılmış içeriğin bulunduğu sayfalarda %93 daha fazla zaman geçirdiler.
  • Okuyucular, yapay zeka tarafından üretilen makalelere kıyasla insan tarafından yazılmış makaleleri ortalama olarak 3,6 kat daha fazla ziyaret etme eğilimindeydi.

Bu AI yayınları, esas olarak gerçek haber içeriklerinden trafik ve potansiyel reklam gelirlerini çekmek için varlar ve geçen yıl 2023'te reklam gösterimlerinin %21'ini ve 10 milyar dolardan fazla geliri ele geçiren, giderek büyüyen içerik çiftçiliği operasyonunun bir parçası olarak hizmet ediyorlar.

Bu sahte haberlerin yaygınlaşmasının yarattığı tehdidi ve potansiyel zararları bilerek, bu sorunun gerçek boyutunu ölçmek istedik. NewsCatcher ile işbirliği yaparak, belirli bir günde dünya çapında yayınlanan haberleri sınıflandırdık.

Deney Kurulumu

İlk olarak, 1 Temmuz 2024 tarihinde yayınlanan tüm dünya haberlerini bir araya getirdik.

NewsCatcher’ın API'si, 75.000'den fazla kaynağa sahip ve büyük kurumsal organizasyonlara hizmet veren, günlük olarak yayınlanan küresel haber makalelerinin en kapsamlı kaynağıdır. Onların teknolojisi, farklı dillerde yazılmış ve geniş bir konu yelpazesini kapsayan, dünyanın dört bir yanından yayınlanan makalelerin tam metnini sorgulamamıza olanak tanıdı.

NewsCatcher'ı kullanarak, bir gün içinde yayınlanan tüm haberleri topladık; bu veri yığınından, 26.675 çevrimiçi yayıncıdan toplanan 857.434 makaleyi analiz ettik ve bunu günlük yayınlanan haberlerin temsil edici bir kümesi olarak kabul ettik.

Algılama Yaklaşımı

Makaleleri temin ettikten sonra, Pangram Text sınıflandırıcıyı çalıştırarak hangi makalelerin AI tarafından üretildiğini belirledik. Pangram Text, sınıflandırma doğruluğu konusunda sektör lideridir (bir sonraki önde gelen ticari çözümden 30 kat daha doğrudur) ve düşük yanlış pozitif vakalarına karşı güçlü bir taahhüdü vardır. Teknik raporumuzda, haberlerdeki yanlış pozitif oranımızın yalnızca %0,001 olduğunu gösteriyoruz, bu da haberleri AI olarak tahmin ederken bunun gerçekten doğru olduğuna güvenmemizi sağlıyor. Çözümümüz genellikle bir belgeyi veya metni alır ve bunun bir LLM tarafından üretilme olasılığını tahmin eder. Bir web sayfası için, yalnızca makale metnini ayırmak için sayfanın içeriğini sonradan işleme tabi tutmalı ve temizlemeliyiz, ancak NewsCatcher çözümünü kullanarak temizlenmiş metni doğrudan çekebildik ve metin sınıflandırıcımızla çıkarımda bulunabildik.

Tahminlerimizin logaritmik ölçekte dağılımı. Logaritmik ölçek kullanarak, 0 veya 1'e yakın tahminlerin, spektrumun ortasındaki tahminlerden 100-1000 kat daha yaygın olduğunu gösteriyoruz.

Ardından yayıncıları, toplam makale sayılarının toplamı olarak sınıflandırdık ve toplam AI içeriğinin dağılımına göre gruplara ayırdık. Gruplandırma çerçevesi şu şekildedir:

  • Bir yayıncının makalelerinin %10'undan azı AI olarak etiketlenmişse, o yayıncı insan yayıncı olarak kabul edilir.
  • Bir yayıncının makalelerinin %10 ila %50'si AI olarak etiketlenmişse, bu yayıncı küçük bir AI yayıncısı olarak kabul edilir.
  • Bir yayıncının makalelerinin %50 ila %80'i AI olarak etiketlenmişse, bu yayıncı büyük bir AI yayıncısı olarak kabul edilir.
  • Bir yayıncının makalelerinin %80'inden fazlası AI olarak etiketlenmişse, bu yayıncı tamamen AI tarafından üretilen bir yayıncı olarak kabul edilir.

Toplam İstatistikler

Örneklemdeki toplam makalelerden şunu tespit ettik:

59.653 makale AI olarak sınıflandırıldı ve bu, makale setinin %6,96'sını temsil ediyor.

Çevrimiçi yayıncıların dağılımı

Yayıncılar, yayınladıkları AI içeriğinin miktarına göre sıralanmıştır. Ardından, makalenin yazıldığı dil, makalenin yayınlandığı ülke, makalenin ele aldığı konu ve özel siyasi önemi gibi temel özellikler üzerinden AI sınıflandırmalarını inceledik.

AI makalelerinin en sık yayınlandığı ülkeler (en az 100 makale)

Ülkelere göre üretilen AI makalelerinin grafiği (ülkelere göre yazılan toplam haber makalelerinin yüzdesi) Genel olarak, Gana'nın yapay zeka tarafından üretilen içerik açısından oldukça güçlü bir istisna olduğunu görüyoruz. Genel sıklık daha düşük olsa da, Hindistan da yapay zeka tarafından üretilen içeriğin önemli bir yayıncısıdır, bu da göz önüne alındığında şaşırtıcı olmamalıdır. deepfake'lerin son Hindistan seçimleri üzerindeki etkisi.

Konuya Göre AI Sıklığı

Konuya göre üretilen AI makalelerinin grafiği (her konu hakkında yazılan toplam haber makalelerinin yüzdesi)

Güzellik (sponsorlu makaleler), teknoloji ve iş dünyası (kripto dolandırıcılığı) konularının, insanların AI makaleleri yazdığı özellikle geniş konular olduğunu fark ettik. Biraz şaşırtıcı bir şekilde, siyaset konusu AI makalelerinde ortalamanın altında kalıyor: Bunun nedeninin, reklamverenlerin marka güvenliği riskleri nedeniyle siyasi haber sitelerinden kaçınmaları ve yayıncıların reklam amaçlı siyasi içerik üretme motivasyonunu düşürmeleri olduğunu düşünüyoruz.

AI "haberleri" nasıl görünür?

AI haber makalelerini birkaç kategoriye ayırıyoruz: reklam amaçlı siteler (MFA'lar), sponsorlu makaleler, dolandırıcılık ve dezenformasyon.

Reklam için üretilmiştir

Meşru içerik sunmak yerine yalnızca reklam göstermeyi amaçlayan bir site, "MFA" (reklam amaçlı site) olarak adlandırılır. İşte bir MFA örneği:

Reklamlarla dolu, reklam amaçlı site

Gördüğümüz gibi, web sitesinin üst kısmında başlık dışında gerçek bir içerik bulunmuyor ve kullanıcının dikkatini çekmek için 8 adet görüntülü reklam yer alıyor. Aşağıdaki AI içeriği aslında okunmak için değil, kullanıcılar genellikle hemen sayfadan ayrılmadan önce siteye ziyaretçileri çekerek reklam gelirini artırmak için yerleştirilmiştir. Reklamverenler genellikle bu sitelerde reklam verdiklerinin farkında bile değildir: dijital reklamcılığın programatik yapısı, bu reklam alanları için tekliflerin otomatik teklif algoritmaları kullanılarak milisaniyeler içinde alınıp satıldığı anlamına gelir. Jounce Media gibi şirketler, reklamverenlerin bu tür sitelerde bütçelerini boşa harcamalarını önlemeye yardımcı olur ve "Tedarik Zinciri Optimize Ediciler" adlı bir şirketler grubunun parçasıdır.

Jounce, MFA'nın üç temel özelliğini şöyle tanımlar:

  1. Ücretli Trafik: Organik kitlesi çok az olan veya hiç olmayan ve diğer sitelerden gelen tıklama tuzağı reklamlardan gelen ziyaretlere bağımlı olan siteler.
  2. Agresif Para Kazanma: Yüksek reklam yükü ve hızlı otomatik yenileme yerleşimleri sayesinde, bu yayıncılar teklif verme pazarları aracılığıyla arbitraj fırsatlarını yakalarlar, ancak bunun bedeli olarak kullanıcı deneyimini olumsuz etkilerler.
  3. Yüzeysel KPI'lar: Bu siteler, görüntülenebilirlik ve video tamamlanma oranları gibi gösterişli metriklerde yüksek puanlar alır, ancak Jounce'un araştırması, MFA'lardaki reklamların aslında alıcıların satın alma kararlarını etkilemediğini göstermektedir.

Özetlemek gerekirse, MFA'lar, reklam alanı arzını ucuza sunmak için meşru içeriğe sahip sitelerden reklam trafiğini çalarlar. Programatik reklam kampanyalarına gösterişli metrikler sunarken, reklamverenlere aslında hiçbir yararlı içerik veya gerçek ROI sağlamazlar. İnterneti kirletir ve ortalama internet tüketicisi için düşmanca bir kullanıcı deneyimi yaratırlar.

MFA'yı tanımlayan somut bir ölçüt olmasa da, MFA'ların çevrimiçi yapay zeka tarafından üretilen içeriğin yaklaşık %50'sini oluşturduğunu tahmin ediyoruz.

Ücretli/Sponsorlu İçerik

İnternetteki bazı haberler, bir ürünü tanıtmak için satın alınabilirken, influencerlar veya meşru inceleme yayınları tarafından yazılmış gerçek içerik gibi gösterilebilir. Güzellik konusunun, yapay zeka tarafından üretilen içeriğin en sık kullanıldığı konulardan biri olduğunu fark ettik. Verileri incelediğimizde, güzellik konusundaki "haber" makalelerinin çoğunun, bunun gibi sponsorlu makaleler olduğunu gördük:

AI bu düşük kaliteli sponsorlu içeriği yazdı.

Birçok metin yazarı, bu düşük kaliteli sponsorlu makaleleri yazmak için yapay zekayı kullanmaya başvuruyor, çünkü amaç, gerçek bir inceleme oluşturmak değil, sadece yerleştirmeyi satmak.

Dolandırıcılık

Kripto dolandırıcıları, yapay zeka kullanarak yüksek hızda içerik üretmektedir.

AI ile oluşturulan birçok sıradan dolandırıcılık kampanyası da görüyoruz. Özellikle kripto dolandırıcılığı çok yaygın görünüyor ve hatta Medium gibi saygın sitelerde bile tanıtılıyor.

Yanlış bilgi

AI içeriğiyle doldurulmuş bir dezenformasyon sitesi

Siyasi haberlerde AI kullanımının genellikle daha az yaygın olduğunu görsek de (bunun büyük bir kısmı, birçok reklamverenin marka güvenliği riski nedeniyle siyasi haberlerden kaçınma eğiliminde olmasından kaynaklanmaktadır), AI dezenformasyon kampanyalarının giderek artan bir bileşenidir. Newsguard, AI destekli dezenformasyonu ayrıntılı ve güncel olarak izleyen bir AI izleme merkezine sahiptir.

Kötü niyetli kişilerin yapay zekayı kullandıkları diğer aldatma biçimlerinden farklı olarak, bu makalelerin amacı aslında insanların içeriği okumasını sağlamaktır. Genellikle, bu kampanyaların amacı belirli bir konu hakkında kamuoyunun duygularını veya görüşlerini değiştirmektir.

Kasım ayında ABD seçimleri yaklaşırken, bu tür AI suistimallerinin devam edeceğini bekleyebiliriz.

Özet

  • 2024 yılının Temmuz ayı itibarıyla, dünyadaki günlük haberlerin yaklaşık %7'si yapay zeka tarafından üretiliyor olabilir.
  • Batı Afrika ve Güney Asya, yayınlanan AI içeriğinin miktarı açısından istisnai durumlardır.
  • Güzellik, teknoloji ve iş dünyası AI içeriğinin en yüksek oranına sahipken, siyaset ve görüşler en düşük orana sahiptir.
  • AI içeriği genellikle bir tür kötü niyet veya aldatıcı davranışla ilişkilendirilir. MFA'lar, reklamverenleri düşük kaliteli reklam alanlarının aslında birinci sınıf olduğuna inandırmaya çalışır. Sponsorlu içerik mutlaka aldatıcı değildir, ancak aynı zamanda gerçek anlamda özgün de değildir ve gerçek bir tüketici yorumu ile karıştırılamaz. Dolandırıcılık ve dezenformasyon, İnternet kullanıcılarını gerçekten tehdit eder ve bu sitelerin neden olabileceği potansiyel zarar açıktır.

Web'deki AI içeriği haritamız veya reklamverenler için AI engelleme listemiz hakkında daha fazla bilgi edinmek ister misiniz? info@pangram.com adresinden bize ulaşın!

Haber bültenimize abone olun
AI algılama araştırmalarımızla ilgili aylık güncellemeleri paylaşıyoruz.