Casos prácticos

Cada día se publican 60 000 artículos de noticias generados por IA

5 de agosto de 2024

Índice

Resumen
Montaje del experimento
Método de detección
Estadísticas agregadas
Desglose de los editores en línea
Países con mayor número de artículos sobre IA (mínimo 100 artículos)
Frecuencia de la IA por tema
¿Cómo son las «noticias» sobre la IA?
Diseñado para la publicidad
Contenido pagado/patrocinado
Estafas
Desinformación
Resumen

Resumen

El sector de la información es una industria de 150 000 millones de dólares que da empleo a miles de reporteros y periodistas para redactar artículos que reciben miles de millones de visitas. Con la IA y el auge de los grandes modelos de lenguaje, muchos sitios web de noticias de baja calidad, así como algunos actores malintencionados, han recurrido a la IA para generar contenidos de forma barata, rápida y a gran escala. Dado que la IA no puede sustituir el papel de un periodista, estos sitios web se limitan a repetir la información de su entrenamiento o a plagiar y reformular los artículos de otros medios.

También se ha demostrado que el contenido poco auténtico resulta menos atractivo y recibe menos visitas por parte de los usuarios de Internet. En una entrada reciente del blog, citamos un estudio realizado por NP Digital que concluía de forma contundente que los lectores en línea preferían y daban prioridad a los artículos escritos por personas. En concreto:

Los lectores pasaron un 93 % más de tiempo en las páginas con contenido redactado por personas que en aquellas con contenido generado exclusivamente por IA.
En promedio, los lectores eran 3,6 veces más propensos a visitar artículos escritos por personas que aquellos generados por IA.

Estas publicaciones generadas por IA existen principalmente para desviar el tráfico y los posibles ingresos publicitarios de los contenidos informativos auténticos, y forman parte de una creciente industria de «fabricación de contenidos» que el año pasado, en 2023, acaparó el 21 % de las impresiones publicitarias y más de 10 000 millones de dólares.

Conscientes de la amenaza y los posibles daños que conlleva este aumento de las noticias falsas, quisimos cuantificar la magnitud real de este problema. Colaboramos con NewsCatcher para clasificar una muestra de noticias publicadas a nivel mundial durante un día concreto.

Montaje del experimento

Empezamos recopilando todas las noticias del mundo publicadas el 1 de julio de 2024.

La API de NewsCatcher es la fuente más completa de artículos de noticias internacionales publicados a diario, con más de 75 000 fuentes y prestando servicio a grandes empresas. Su tecnología nos permitió realizar búsquedas en el texto completo de artículos publicados en todo el mundo, redactados en diferentes idiomas y que abarcan una amplia variedad de temas.

Mediante NewsCatcher, recopilamos todas las noticias publicadas en un día; a partir de este conjunto de datos, analizamos 857 434 artículos procedentes de 26 675 medios digitales, que consideraremos una muestra representativa de las noticias diarias publicadas.

Método de detección

Tras recopilar los artículos, ejecutamos nuestro clasificador Pangram Text para determinar cuáles habían sido generados por IA. Pangram Text es líder del sector en precisión de clasificación (más de 30 veces más preciso que la siguiente solución comercial más destacada), con un firme compromiso de reducir la incidencia de falsos positivos. En nuestro informe técnico, demostramos que nuestra tasa de falsos positivos en las noticias es de solo el 0,001 %, lo que nos permite estar seguros de que, cuando predecimos que una noticia ha sido generada por IA, así es realmente. Nuestra solución suele tomar un documento o un fragmento de texto y devuelve una predicción de la probabilidad de que haya sido generado por un LLM. En el caso de una página web, tendríamos que realizar un procesamiento posterior y una limpieza del contenido de la página para aislar únicamente el texto del artículo, pero utilizando la solución NewsCatcher pudimos extraer el texto limpio directamente y ejecutar la inferencia con nuestro clasificador de texto.

Distribución de nuestras predicciones en una escala logarítmica. Utilizamos una escala logarítmica para mostrar que las predicciones cercanas a 0 o 1 son entre 100 y 1000 veces más frecuentes que las predicciones situadas en el centro del espectro.

A continuación, clasificamos a los editores en función de la suma total de sus artículos y los agrupamos según el desglose de su contenido generado por IA. El esquema de agrupación es el siguiente:

Si un editor tuviera menos del 10 % de sus artículos etiquetados como «IA», se le consideraría un editor humano
Si una editorial tuviera entre el 10 % y el 50 % de sus artículos etiquetados como «IA», se la consideraría una editorial de IA de menor importancia
Si una editorial tuviera entre el 50 % y el 80 % de sus artículos etiquetados como «IA», se la consideraría una editorial importante en el ámbito de la IA
Si una editorial tuviera más del 80 % de sus artículos etiquetados como «IA», se consideraría que se trata de una editorial cuyos contenidos están generados íntegramente por IA

Estadísticas agregadas

Del total de artículos analizados, observamos que:

Se clasificaron 59 653 artículos como IA, lo que representa el 6,96 % del conjunto de artículos.

Desglose de los editores en línea

Editoriales clasificadas según la cantidad de contenido sobre IA que publican A continuación, analizamos las clasificaciones de la IA en función de una serie de características clave, entre las que se incluyen el idioma en el que estaba escrito el artículo, el país en el que se publicó y el tema que trataba, así como su especial relevancia política.

Países con mayor número de artículos sobre IA (mínimo 100 artículos)

Gráfico de artículos sobre IA publicados por país (porcentaje del total de artículos periodísticos escritos por país) En general, observamos que Ghana destaca bastante en lo que respecta al contenido generado por IA. Aunque la frecuencia general es menor, la India también es un importante productor de contenido generado por IA, lo cual no debería sorprender teniendo en cuenta que el impacto de los deepfakes en las recientes elecciones de la India.

Frecuencia de la IA por tema

Gráfico de artículos sobre IA por tema (porcentaje del total de artículos periodísticos escritos sobre cada tema)

Hemos observado que la belleza (artículos patrocinados), la tecnología y los negocios (estafas con criptomonedas) son temas especialmente recurrentes en los artículos sobre IA. Resulta algo sorprendente que la política ocupe un lugar por debajo de la media en lo que respecta a los artículos sobre IA: creemos que esto se debe a que los anunciantes suelen evitar los sitios web de noticias políticas debido a los riesgos para la seguridad de la marca, lo que reduce el incentivo de los editores para producir contenidos políticos destinados a la publicidad.

¿Cómo son las «noticias» sobre la IA?

Identificamos varias categorías de artículos de noticias sobre IA: sitios web creados con fines publicitarios (MFA), artículos patrocinados, fraudes y desinformación.

Diseñado para la publicidad

Un sitio web cuyo único objetivo es mostrar anuncios en lugar de ofrecer contenido legítimo se denomina «MFA», es decir, un sitio creado para la publicidad. He aquí un ejemplo de un MFA:

Sitio web creado con fines publicitarios y repleto de anuncios

Como podemos ver, en la parte superior de la página web no hay contenido real más allá del título, y hay ocho anuncios gráficos que compiten por captar la atención del usuario. El contenido generado por IA que aparece más abajo no está pensado realmente para ser leído: solo está ahí para atraer visitantes al sitio y generar ingresos publicitarios antes de que los usuarios, por lo general, abandonen la página de inmediato. A menudo, los anunciantes ni siquiera son conscientes de que están anunciándose en estos sitios: la naturaleza programática de la publicidad digital implica que las pujas por este espacio publicitario se compran y venden en cuestión de milisegundos mediante algoritmos de puja automatizados. Empresas como Jounce Media ayudan a los anunciantes a evitar malgastar su presupuesto en sitios como este, y forman parte de un grupo de empresas denominado «optimizadores de la cadena de suministro».

Jounce define tres características clave de un MFA:

Tráfico de pago: sitios web que tienen poca o ninguna audiencia orgánica y dependen de las visitas procedentes de anuncios sensacionalistas de otros sitios web.
Monetización agresiva: mediante una elevada carga publicitaria y anuncios que se actualizan automáticamente a gran velocidad, estos editores aprovechan una oportunidad de arbitraje en los mercados de pujas, pero a costa de ofrecer una experiencia de usuario desagradable.
Indicadores clave de rendimiento (KPI) superficiales: Estos sitios obtienen puntuaciones elevadas en métricas de vanidad, como la visibilidad y las tasas de finalización de los vídeos, pero el estudio de Jounce revela que los anuncios en los sitios de «microfinanzas» (MFA) no influyen realmente en las decisiones de compra de los usuarios.

En resumen, los MFAs roban tráfico publicitario a sitios web con contenido legítimo para poder ofrecer espacios publicitarios a bajo coste. Proporcionan métricas engañosas a las campañas publicitarias programáticas, sin aportar en realidad ningún contenido útil ni un retorno de la inversión real a los anunciantes. Contaminan Internet y crean una experiencia de usuario hostil para el internauta medio.

Aunque no existe una métrica concreta que defina qué es un MFA, calculamos que los MFA representan aproximadamente el 50 % del contenido generado por IA en Internet.

Contenido pagado/patrocinado

Algunas noticias que aparecen en Internet pueden comprarse como medio para publicitar un producto, al tiempo que se hacen pasar por contenido real escrito por un influencer o una publicación de reseñas legítima. Nos dimos cuenta de que la belleza era uno de los temas con mayor frecuencia de contenido generado por IA. Al analizar los datos en profundidad, descubrimos que gran parte de los artículos de «noticias» sobre el tema de la belleza son simplemente artículos patrocinados como este:

Este contenido patrocinado de baja calidad lo ha redactado una IA

Muchos redactores publicitarios están recurriendo simplemente al uso de la inteligencia artificial para redactar estos artículos patrocinados de baja calidad, ya que el objetivo es simplemente vender el espacio publicitario, en lugar de generar una reseña auténtica.

Estafas

Los estafadores del mundo de las criptomonedas utilizan la inteligencia artificial para generar contenido a gran velocidad

También observamos muchas campañas fraudulentas de lo más comunes generadas con IA. En concreto, las estafas relacionadas con las criptomonedas parecen ser muy habituales, e incluso se promocionan en sitios de prestigio como Medium.

Desinformación

Un sitio web de desinformación repleto de contenido generado por IA

Aunque observamos que el uso de la IA suele ser menos frecuente en las noticias políticas (en gran parte debido a que muchos anunciantes tienden a evitar este tipo de noticias por el riesgo que supone para la seguridad de la marca), la IA es un componente cada vez más importante de las campañas de desinformación. Newsguard cuenta con un centro de seguimiento de la IA que ofrece un seguimiento detallado y actualizado de la desinformación generada mediante IA.

A diferencia de otras formas de engaño en las que vemos a personas malintencionadas utilizar la IA, el objetivo de estos artículos es, en realidad, conseguir que la gente lea el contenido. Por lo general, el propósito de estas campañas es influir en la opinión pública o cambiar la percepción de la gente sobre un tema concreto.

A medida que se acercan las elecciones estadounidenses de noviembre, no podemos sino esperar que este tipo de uso indebido de la IA continúe.

Resumen

Se calcula que, en julio de 2024, alrededor del 7 % de las noticias diarias de todo el mundo son generadas por la inteligencia artificial.
África Occidental y Asia Meridional son casos atípicos en lo que respecta a la cantidad de contenido sobre IA publicado.
Los temas de belleza, tecnología y negocios son los que cuentan con una mayor proporción de contenido sobre IA, mientras que la política y las opiniones son los que tienen la menor.
El contenido generado por IA suele asociarse con algún tipo de mala intención o comportamiento engañoso. Las redes de sitios web falsos (MFA) intentan engañar a los anunciantes haciéndoles creer que un espacio publicitario de baja calidad es, en realidad, de primera categoría. El contenido patrocinado no es necesariamente engañoso, pero tampoco es genuinamente auténtico y no puede confundirse con una reseña real de un consumidor. Las estafas y la desinformación suponen una amenaza real para los usuarios de Internet, y el daño potencial que causan estos sitios es evidente.

¿Quieres saber más sobre nuestro mapa de contenidos de IA en la web o sobre nuestra lista de bloqueo de IA para anunciantes? ¡Escríbenos a info@pangram.com!

Bradley EmiDirector técnico y cofundador

Bradley es investigador en inteligencia artificial y experto en el desarrollo de productos de aprendizaje profundo para el sector industrial. Recientemente ha dirigido el grupo de investigación en aprendizaje profundo de Absci, una empresa dedicada al descubrimiento de fármacos mediante IA generativa, y anteriormente formó parte del equipo principal de visión artificial de Tesla Autopilot.

Durante sus estudios de posgrado, Bradley fue autor de varias publicaciones sobre investigación en aprendizaje profundo en el Stanford Vision Lab. Es licenciado en Física y tiene un máster en Inteligencia Artificial por la Universidad de Stanford. Además de la IA, le apasionan la educación y la filosofía, y es un ávido golfista.

Más de Bradley Emi

Lecturas relacionadas

Cómo detectar las reseñas generadas por IA

Casos prácticos

Cómo detectar las reseñas generadas por IA

«¿Cómo se puede detectar un texto generado por IA?» Bueno, como se suele decir, el estilo es el sello distintivo. Empecemos con un ejemplo sencillo.

Max Spero5 de diciembre de 2023

Evaluaciones de pangramas realizadas por terceros

Casos prácticos

Evaluaciones de pangramas realizadas por terceros

Las pruebas internas de Pangram resisten el escrutinio de terceros.

Destiny Akinode4 de noviembre de 2025

El 67 % de las personas que consumen contenidos en línea detectan información engañosa generada por la IA

Casos prácticos

El 67 % de las personas que consumen contenidos en línea detectan información engañosa generada por la IA

A medida que mejora el contenido generado por IA, cada vez es más difícil distinguir entre lo que es obra humana y lo que es obra de ChatGPT. Los nuevos datos de Pangram revelan que a mucha gente le cuesta diferenciar entre ambos.

Max Spero15 de mayo de 2026

Cómo utiliza Quora Pangram para gestionar las respuestas redactadas por IA

Casos prácticos

Cómo utiliza Quora Pangram para gestionar las respuestas redactadas por IA

En abril de 2024, Pangram Labs se asoció con Quora para ayudarles a hacer frente a los spammers que utilizaban ChatGPT para responder a las publicaciones con respuestas falsas generadas por IA.

Max Spero26 de septiembre de 2024

El tres por ciento de las reseñas que aparecen en la primera página de Amazon están generadas por IA

Casos prácticos

El tres por ciento de las reseñas que aparecen en la primera página de Amazon están generadas por IA

A pesar de que la FTC ha dictaminado que las reseñas generadas por IA son ilegales, hay personas malintencionadas que siguen publicando reseñas de productos generadas por modelos de lenguaje grande (LLM) que engañan a los clientes. ¡Ni siquiera Amazon es capaz de detectar todas estas reseñas!

Max Spero4 de mayo de 2026

Cómo preparar tu empresa para el LLM y la IA general

Casos prácticos

Cómo preparar tu empresa para el LLM y la IA general

Podría decirse que «la persona del año 2023» ha sido la IA.

Max Spero y Theodoros Evgeniou30 de enero de 2024

Suscríbete a nuestras novedades en

Manténgase informado con nuestras últimas noticias y ofertas.

soc2

SOC2 TIPO 2

Verificado por AssuranceLab

© 2025 Pangram. Todos los derechos reservados.

info@pangram.com

Únete a nuestra comunidad

© 2025 Pangram. Todos los derechos reservados.

Cada día se publican 60 000 artículos de noticias generados por IA | Pangram Labs