Educação em IA

Um passeio pelas expressões mais usadas na IA

21 de fevereiro de 2025

Índice

Parte 1: Artefactos de IA
Parte 2: Expressões muito usadas
Parte 3: Por que é que a IA usa frases repetidamente?
Bónus: Os N-grams preferidos da nossa equipa

Como discutimos na semana passada, a IA tende a usar em excesso certas palavras e expressões. É provável que se lembre de algumas delas de imediato: desde «uma prova de» até «aprofundar». Encontrar um número suficiente dessas expressões pode ser um forte indicador de que o texto com que se depara foi gerado por IA, mas são demasiadas para que uma única pessoa consiga acompanhar todas.

Para resolver este problema, lançámos recentemente uma ferramenta chamada «Frases de IA», na qual destacamos especificamente essas frases. No âmbito do processo de desenvolvimento dessa ferramenta, criámos um vasto conjunto de dados com as frases de IA mais utilizadas. Neste artigo, iremos apresentar-lhe algumas das frases de IA mais comuns que constam do nosso conjunto de dados e explicar-lhe como pode utilizá-las para aperfeiçoar a sua própria intuição em relação ao texto gerado por IA.

Parte 1: Artefactos de IA

Devemos começar pelo mais óbvio: por vezes, uma IA chega mesmo a dizer que é uma IA! Muitas vezes, isto acontece na sequência de uma recusa. Quando um utilizador pede a uma IA algo que esta foi instruída a não fazer, ela tem de informar o utilizador de que não pode satisfazer o pedido e, nesse contexto, o modelo reconhece frequentemente que é uma IA. Muitas recusas da IA começam com a frase «Como modelo de linguagem de IA...» Segue-se que este tipo de frase seria bastante comum em textos de IA e extremamente raro em textos humanos. Os números confirmam isto! Muitas das nossas frases de IA mais comuns são autorreferenciais.

Frase	Mais comum
Como um modelo de linguagem de IA,	294,000x
Não tenho pessoal	67,000x
Infelizmente, não tenho o suficiente.	54,000x
modelo linguístico, não consigo	53,000x

Parte 2: Expressões muito usadas

Os «artefactos de IA» são algumas das expressões «mais utilizadas» no âmbito da IA, mas, no fundo, são bastante óbvias e, por isso, pouco interessantes. Agora chegamos à parte interessante: expressões que estão, de facto, sobrerrepresentadas nos textos sobre IA, mas que nada têm a ver com «ser uma IA». Aqui estão algumas:

Frase	Mais comum
como um comovente	49,000x
Como um poderoso lembrete	43,000x
lembrete do duradouro	31,000x
enfrentou inúmeros desafios	30,000x
Os nossos resultados fornecem novas perspetivas sobre	22,000x
na complexa interação	21,000x
serve como um poderoso	10,000x
fornecendo informações valiosas sobre	5,000x
serve como testemunho	4,000x
novo sentido de propósito	4,000x
mesmo diante do inimaginável	3,000x
lembrete do potencial	3,000x

Parte 3: Por que é que a IA usa frases repetidamente?

É fácil compreender por que razão uma IA que diz «Como IA...» pode ser muito mais comum nos textos gerados por IA. Mas o que faz com que as frases aparentemente sem relação entre si, na Parte 2, sejam mais comuns? Em primeiro lugar, existe um fenómeno conhecido como «colapso de modo», em que as respostas da IA se tornam excessivamente genéricas ou repetitivas ao basearem-se em sequências de palavras de alta probabilidade. O colapso de modo...

Além disso, após o treino, é prática comum recorrer ao RLHF: Aprendizagem por Reforço a partir do Feedback Humano. Durante este processo, os anotadores humanos avaliam o texto gerado pela IA com base numa série de atributos, com o objetivo de incentivar certos padrões e desencorajar outros. Ao longo deste processo, se determinadas respostas ou frases forem suscetíveis de serem recompensadas por esses anotadores humanos, tornar-se-ão cada vez mais frequentes.

Consequentemente, algumas destas expressões sobreutilizadas podem ser consideradas uma característica de modelos, arquiteturas e processos de treino específicos, em vez de serem apenas traços distintivos da própria escrita gerada por IA. Um artigo de Jenna Russell, Marzena Karpinska e Mohit Iyyer, da Universidade de Maryland, demonstra que modelos diferentes têm, de facto, expressões preferidas distintas:

usado em excesso

usado em excesso

Isto sugere que diferentes modelos, treinados com diferentes conjuntos de dados e estratégias de otimização, podem desenvolver as suas próprias tendências distintas no que diz respeito à repetição de frases.

Bónus: Os N-grams preferidos da nossa equipa

No âmbito do nosso trabalho, a nossa equipa dedicou inúmeras horas à leitura e análise de textos gerados por IA. Naturalmente, acabámos por criar uma certa afinidade com algumas dessas frases:

Eis as frases favoritas da nossa equipa relacionadas com a IA:

Max (CEO): «Num mundo em constante evolução» (11 000x)
Bradley (Diretor Técnico): «É importante notar» (3 000 vezes)
Lu (Engenheiro Fundador): «natureza complexa» (6 000 vezes)
Elyas (Engenheiro Fundador): «tapeçaria vibrante» (17 000x)

Elyas MasrourEngenheiro fundador

Elyas Masrour é engenheiro fundador da Pangram. Desde que ingressou na Pangram como segundo colaborador, logo após terminar o curso na Universidade de Maryland, desenvolveu infraestruturas essenciais, tais como a API de disponibilização de modelos, controlos de acesso baseados em funções e pipelines de evidências de apoio. Elyas também trabalha em estreita colaboração com a equipa de investigação em projetos como a robustez adversária, a interpretabilidade de modelos e a deteção de conteúdo misto heterogéneo. Fora do trabalho, Elyas aprecia uma vasta gama de formas de criatividade e expressão humanas, incluindo cinema, leitura e explorar a cidade.

Mais de Elyas Masrour

Leitura relacionada

O Google vai penalizar o conteúdo gerado por IA em 2026?

Educação em IA

O Google vai penalizar o conteúdo gerado por IA em 2026?

O Google penaliza o conteúdo gerado por IA? Há quem pense que o Google está sempre atento ao conteúdo gerado por IA e que, em condições iguais… o classifica em posições mais baixas. Mas a realidade é mais complexa.

Alex Roitman30 de janeiro de 2026

O estado da integridade académica e da deteção por IA em 2025

Educação em IA

O estado da integridade académica e da deteção por IA em 2025

Bradley Emi, diretor técnico da Pangram Labs, proferiu uma palestra sobre o estado da deteção por IA na conferência da ICAI.

Destiny Akinode4 de dezembro de 2025

Como identificar textos escritos por IA

Educação em IA

Como identificar textos escritos por IA

O ChatGPT e outros modelos de linguagem de grande escala (LLMs), geralmente designados em conjunto por «IA», tornaram-se ferramentas cada vez mais populares.

Max Spero17 de junho de 2024

Tudo sobre os falsos positivos nos detetores de IA

Educação em IA

Tudo sobre os falsos positivos nos detetores de IA

Uma análise aprofundada sobre como a Pangram consegue taxas de falsos positivos líderes no setor na deteção por IA, com uma taxa de falsos positivos de 1 em 10 000.

Bradley Emi27 de março de 2025

Verificadores de IA para professores: por que razão as escolas precisam de ferramentas de deteção por IA

Educação em IA

Verificadores de IA para professores: por que razão as escolas precisam de ferramentas de deteção por IA

Conheço muitos professores que partilham a mesma opinião sobre a verificação de textos dos alunos com recurso à IA. Ouço frequentemente: «Conheço bem a escrita dos meus alunos, por isso não preciso de software de deteção de IA.»

Jason Nicholson4 de fevereiro de 2025

Que detetor de IA devem as universidades utilizar? O Padrão Académico de 2026

Educação em IA

Que detetor de IA devem as universidades utilizar? O Padrão Académico de 2026

O meio académico está a enfrentar uma explosão na utilização da IA generativa. As universidades tiveram de rever rapidamente as suas políticas de integridade académica.

Alex Roitman11 de maio de 2026

Inscreva-se em
para receber as nossas atualizações

Mantenha-se informado com as nossas últimas notícias e ofertas.

soc2

SOC2 TIPO 2

Verificado pela AssuranceLab

© 2025 Pangram. Todos os direitos reservados.

info@pangram.com

Junte-se à nossa comunidade

© 2025 Pangram. Todos os direitos reservados.

Analisando as frases mais utilizadas em IA | Pangram Labs