Anunciamos uma nova parceria com a Proofig! Saiba mais

Apresentando as frases de IA da Pangram

Elias Masrour
14 de fevereiro de 2025

Se prestar bastante atenção, muitas vezes poderá encontrar indicadores num texto que sugerem que ele foi escrito por IA. Certas estruturas de frases, escolhas de palavras ou formatação aparecem com muito mais frequência em textos de IA do que em textos humanos.

Talvez já conheça algumas frases que parecem indicar que um texto foi gerado por IA. Há muitos exemplos: «tecido complexo», «um testemunho de» ou até mesmo a palavra «mergulhar», como o escritor e investidor Paul Graham divulgou amplamente.

Tweet de Paul Graham

Agora, se é um utilizador regular do painel do Pangram, também deve ter notado que começámos a destacar as frases de IA mais utilizadas, como «tapeçaria complexa» no ensaio de IA abaixo.

Esta é a nova ferramenta AI Phrases da Pangram! Veja como funciona:

Quando digitaliza um documento e o Pangram deteta que ele foi gerado por IA, realizamos uma segunda digitalização para procurar frases comuns de IA.

Para treinar o nosso modelo para que seja altamente preciso, usamos conjuntos de dados internos com dezenas de milhões de documentos gerados por humanos e por IA. Separadamente, a nossa equipa pode analisar esses dois conjuntos de dados em busca de sequências comuns de palavras em textos escritos por humanos e por IA. Em seguida, podemos comparar as estatísticas para ver se a IA realmente usa certas frases em excesso. Usamos uma técnica chamada análise N-Gram (o som semelhante a PaNGram pode não ser coincidência 😊), e os resultados são impressionantes. Vemos claramente que existem inúmeras frases que a IA parece usar com muito mais frequência do que os humanos. São tantas, na verdade, que decidimos criar uma ferramenta para exibir essas frases diretamente no painel do Pangram.

Por que isso é importante?

Aqui na Pangram, estamos interessados em preservar as vozes humanas. Temos o nosso modelo de deteção principal, capaz de processar centenas de milhares de detalhes sobre um texto para determinar se ele foi ou não gerado por IA.

No entanto, também estamos interessados na explicabilidade. Saber que uma determinada frase está altamente sobrerrepresentada no texto da IA pode permitir que compreenda melhor (e explique aos outros!) por que podemos ter detetado um trecho de texto como sendo da IA ou não. Se sabe que um texto tem várias frases que aparecem centenas ou milhares de vezes mais frequentemente no texto da IA do que no texto humano, agora tem mais evidências quantificáveis para apoiar o nosso julgamento.

Queremos manter os nossos utilizadores informados não só sobre se um texto foi gerado por IA, mas também sobre como podemos saber isso. As frases de IA são uma parte fundamental dessa missão e da nossa jornada geral em direção à interpretabilidade.

Em futuras publicações no blog, abordaremos algumas das expressões mais utilizadas em relação à IA, portanto, fique atento! Para obter mais informações sobre o Pangram ou os nossos recursos de interpretabilidade, entre em contacto connosco pelo e-mail info@pangram.com.

Inscreva-se na nossa newsletter
Partilhamos atualizações mensais sobre a nossa investigação em deteção de IA.