Será que a IA está a escrever as notícias?
Uma análise recente revela que 9 % das notícias publicadas recentemente contêm texto gerado por IA.
Introdução
Investigadores da Universidade de Maryland, utilizando a tecnologia de deteção de IA da Pangram, descobriram que mais de 9 % de toda a cobertura noticiosa continha texto gerado por IA, tendo esse texto também aparecido nas páginas de opinião do The New York Times, do The Wall Street Journal e do The Washington Post.
A IA está a transformar profundamente o panorama dos conteúdos na Internet. Proporcionou aos criadores de conteúdos a capacidade de gerar, expandir, resumir e parafrasear textos em grande escala. Esta nova e poderosa tecnologia, combinada com a tendência disruptiva do colapso dos modelos de negócio dos jornais, resultou no aumento do conteúdo gerado por IA nos jornais dos EUA. Consideramos urgente acompanhar a quantidade de conteúdo gerado por IA que está a ser criado e onde é mais provável que os leitores o encontrem.
Estimamos que cerca de 9 % dos artigos de jornal recém-publicados sejam parcial ou totalmente gerados por IA.
IA nas notícias
9 % dos artigos de jornal recém-publicados são gerados, parcial ou totalmente, por IA.
| Categoria | Porcentagem |
|---|---|
| Humano | 90.9% |
| IA | 5.2% |
| Misto | 3.9% |
Áreas de foco para textos gerados por IA
Os jornais locais estão a adotar a IA
Os jornais locais têm enfrentado pressões económicas que resultaram na redução de recursos e de pessoal. Mesmo antes do surgimento dos LLMs, os jornais locais já se encontravam sob pressão devido à consolidação e enfrentavam dificuldades em rentabilizar os seus conteúdos, o que deu origem a «desertos informativos». Consequentemente, muitos adotaram a IA para operar de forma mais eficiente (Northwestern Report). Qual é a dimensão deste aumento na utilização da IA para artigos noticiosos?
Apenas 1,7% dos artigos publicados em jornais com tiragem superior a 100 000 exemplares são parcial ou totalmente gerados por IA, contra 9,3% nos jornais com tiragem inferior a 100 000 exemplares. Estes padrões sugerem que a adoção da IA é muito mais comum entre os órgãos de comunicação de pequena e média dimensão do que entre os maiores jornais nacionais, que parecem impor restrições editoriais mais rigorosas à automatização.
Utilização da IA por dimensão do jornal
Proporção de artigos com texto gerado por IA
| Categoria | Porcentagem |
|---|---|
| <100k circulation | 9.3% |
| >100 mil exemplares distribuídos | 1.7% |
Os artigos com grande quantidade de dados têm mais probabilidades de conter texto gerado por IA
É mais provável que a IA seja utilizada em áreas temáticas específicas. Por exemplo, os artigos sobre o tempo no nosso conjunto de dados apresentam a maior probabilidade média de utilização de IA (27,7 %). Outros temas com elevada utilização de IA incluem ciência e tecnologia (16,1%) e saúde (11,7%). Em contrapartida, os conteúdos sobre questões mais sensíveis, como conflitos e guerra (4,3%), crime, direito e justiça (5,2%) e religião (5,3%), apresentam taxas significativamente mais baixas de utilização de IA.
Probabilidade de IA por tema
Probabilidade média de IA em todas as categorias
| Categoria | Porcentagem |
|---|---|
| Clima | 27.7% |
| Ciência e Tecnologia | 16.1% |
| Saúde | 11.7% |
| Religião | 5.3% |
| Crime, Direito e Justiça | 5.2% |
| Conflito e Guerra | 4.3% |
Os artigos de opinião não estão imunes à IA
Uma análise dos artigos de opinião do WSJ, do NYT e do Washington Post revela que 4,5% dos artigos continham texto gerado por IA na amostra de junho a setembro de 2025. Os colaboradores convidados publicaram texto gerado por IA a uma taxa mais elevada do que os redatores da casa. Encontrámos 428 artigos contendo texto escrito por IA na nossa análise e esse número está a aumentar. Os artigos de opinião publicados no NYT, WaPo e WSJ têm 6,4 vezes mais probabilidades de conter conteúdo de IA do que os artigos de notícias contemporâneos dos mesmos três jornais.

Uma falta significativa de divulgação
Uma vez que a confiança do público depende, em parte, da visibilidade do envolvimento da IA, analisámos a frequência com que os jornais divulgam essa utilização. Numa amostra de 100 artigos marcados como tendo sido produzidos por IA, provenientes de jornais distintos, 95% dos autores e 97% dos editores não referiram a IA. As poucas divulgações que observámos apareceram apenas em reportagens ambientais, tais como previsões meteorológicas e alertas sobre a qualidade do ar. Entre três publicações com políticas formais de divulgação, apenas dois artigos cumpriram as regras, enquanto outra violou a sua própria política ao omitir a divulgação. Notavelmente, dois jornais com proibições explícitas sobre IA publicaram, mesmo assim, artigos que o nosso classificador identificou como gerados por IA.
Explore os dados
O Painel de Dados do AI News Monitor permite aos leitores e observadores do mundo da informação acompanhar as tendências na utilização da IA nas páginas de notícias e de opinião. Esta ferramenta facilita a exploração e o acompanhamento da evolução da utilização da IA ao longo do tempo.
Metodologia
Investigadores da Universidade de Maryland recolheram estes conjuntos de dados de jornais americanos:
- Recolhemos 186 507 artigos publicados por 1 528 jornais norte-americanos com feeds RSS ativos (tanto locais como nacionais) entre junho e setembro de 2025. A lista de jornais foi obtida no site onlinenewspapers.com.
- Recolhemos 44 803 artigos de opinião: 16 964 do WSJ, 15 977 do WP e 11 862 do NYT entre agosto de 2022 e setembro de 2025.
Avaliámos cada artigo com o software de deteção de IA Pangram, a fim de obter tanto um índice de probabilidade de IA (de 0 a 100 %) como uma classificação categórica. Também realizámos uma classificação por tema de cada artigo e associamos cada jornal aos metadados relativos à tiragem e à propriedade, sempre que disponíveis.
A ferramenta de deteção de IA da Pangram foi avaliada de forma independente por membros do Instituto Becker Friedman da Universidade de Chicago. No estudo de setembro de 2025, a Pangram apresentou uma taxa de falsos positivos de 0,08% para notícias e uma taxa de falsos negativos de 0,33% ou menos para conteúdos noticiosos. (Estudo da Universidade de Chicago)
