Anunciamos uma nova parceria com a Proofig! Saiba mais
TLDR; Acadêmicos e moderadores de conteúdo devem reavaliar suas avaliações das ferramentas de detecção de IA ou verificadores de IA. O consenso anterior formado em 2023 a partir de artigos acadêmicos e mídia popular está desatualizado. Os modelos mais recentes de detecção de IA, como o Pangram, não apenas alcançaram os LLMs mais recentes, mas estão sendo construídos para serem à prova de futuro.
Quando o ChatGPT foi lançado em 2022, escritores e criadores de conteúdo migraram para a nova ferramenta de inteligência artificial para criar. E isso não parou desde então. Os criadores aproveitaram o ChatGPT (e outros modelos de IA) e seus concorrentes para escrever de tudo, desde documentos grandes, como trabalhos de pesquisa e romances, até pequenos trechos, como e-mails, comentários no Reddit e avaliações na Amazon. O conteúdo gerado por IA inundou a internet. No entanto, desde o início dos LLMs, tem havido uma demanda para separar o que é escrito por humanos e o que é escrito por IA. A OpenAI percebeu essa necessidade e criou um produto que classificaria o texto como IA. À medida que a adoção da IA aumentou, a demanda por detectores ou classificadores de IA também aumentou, especialmente em escolas e universidades, onde a integridade acadêmica é fundamental. Alguns alunos (que geralmente são os primeiros a adotar novas tecnologias) usaram os modelos mais recentes para concluir tarefas, fazer testes e se inscrever em faculdades. Alguns investigadores, sob pressão de tempo, tomaram atalhos e enviaram trabalhos escritos ou assistidos por IA para publicação. Portanto, muitas ferramentas foram lançadas na esperança de resolver essas preocupações. Empresas de software académico estabelecidas, como a TurnItIn, lançaram uma ferramenta em abril de 2023 chamada AI Checker para atender aos clientes existentes na área da educação. A Grammarly também lançou a sua própria ferramenta em 2024, chamada Grammarly Authorship. O pensamento predominante dessas empresas era que, se as suas ferramentas podiam identificar plágio, elas também deveriam identificar IA. O ensino superior, em particular, precisava fazer a transição de «verificadores de plágio» para «verificadores de IA». No entanto, ficou claro desde o início que isso não iria funcionar.
Os primeiros detetores de IA prometiam precisão usando perplexidade e explosividade. O diretor técnico da Pangram, Bradley Emi, explica estes termos:«Perplexidade é o quão inesperada ou surpreendente é cada palavra num texto. Explosividade é a mudança na perplexidade ao longo de um documento. Se algumas palavras e frases surpreendentes estiverem intercaladas ao longo do documento, então ele tem alta explosividade.»
Não vamos nos prender a esses termos, mas basear-se excessivamente nesses fatores ao criar uma ferramenta de detecção de IA resulta em três falhas consistentes:
Essas são preocupações reais, especificamente para instituições académicas. O peso de acusar falsamente estudantes e investigadores de usar IA nos seus estudos e trabalhos é enorme. Isso pode arruinar carreiras. É incrivelmente arriscado confiar em ferramentas com até 95% de eficácia para filtrar IA. Por isso, muitas instituições académicas de renome, como o MIT, a Vanderbilt e a UC Berkeley, não apoiam o uso de detetores de IA pelos seus professores. Em muitos casos, elas citaram trabalhos de investigação específicos que descreveram o fraco desempenho dos detetores de IA, como Testing of Detection Tools for AI-Generated Text(Teste de ferramentas de deteção de texto gerado por IA), e artigos da indústria, como Why AI writing detectors don’t work(Por que os detetores de escrita por IA não funcionam).
A OpenAI considerou essas questões tão difíceis que desistiu do seu Classificador de Texto de IA em julho de 2023, alegando que «o classificador de IA não está mais disponível devido à sua baixa taxa de precisão». Muitos administradores escolares chegaram a uma conclusão: se a OpenAI não consegue fazer isso, provavelmente é impossível.
Enquanto as melhores universidades e o público em geral chegaram a um consenso de que a promessa da detecção de IA era impossível ou mesmo uma farsa, empresas como a Pangram Labs desenvolveram melhorias significativas na área, tornando a detecção de IA uma ferramenta fundamental em ambientes universitários e empresariais.
A deteção de IA é frequentemente referida como uma corrida armamentista entre estudantes que procuram atalhos e educadores que procuram filtrar o que é escrito por humanos e o que não é. Em 2025, os detetores aumentaram as apostas.
Em agosto de 2025, dois investigadores da Chicago Booth, Brian Jabarian e Alex Emi, publicaram um artigo intitulado Escrita Artificial e Detecção Automatizada, afirmando que «a maioria dos detetores comerciais de IA tem um desempenho notável, com o Pangram, em particular, a atingir taxas de falsos positivos e falsos negativos próximas de zero». Eles destacam o Pangram como «o único detetor que cumpre um limite rigoroso (taxas de falsos positivos ≤ 0,005) sem comprometer a capacidade de detetar com precisão textos gerados por IA». Este é um exemplo de quão longe a detecção de IA chegou em poucos anos. Mas como isso aconteceu?
Primeiro, os investigadores de IA melhoraram os conjuntos de dados ao recolher uma gama mais ampla de textos humanos e textos gerados por IA. Isso inclui não apenas artigos académicos, mas também outros tipos de textos, como e-mails e artigos. Em segundo lugar, os programadores empregaram a aprendizagem ativa para reduzir as taxas de falsos positivos. Isso significa que eles procuram os textos mais difíceis de classificar como IA ou humanos e, em seguida, reintegram-nos nos seus modelos.
E na corrida armamentista, os criadores de IA geral não responderam o suficiente para quebrar alguns detectores de IA. Quando o tão badalado GPT-5 da OpenAI foi lançado, ele prometia menos alucinações, tom aprimorado e escrita mais criativa. Em 12 horas, o cofundador da Pangram Labs, Max Spero, publicou no LinkedIn que, sem qualquer treinamento adicional, a ferramenta de detecção de IA da Pangram poderia classificar os testes do GPT-5 a uma taxa semelhante à dos modelos anteriores:
“O Pangram é o único detetor de IA capaz de detectar o GPT-5 de forma fiável sem ter sido explicitamente treinado para tal.”
Existem preocupações genuínas sobre o uso de detetores de IA. Muitos deles ainda apresentam taxas alarmantes de falsos positivos e anunciam falsamente a sua precisão. No entanto, algumas das tecnologias mais recentes são incrivelmente confiáveis e estão a ser ativamente integradas em empresas e universidades. Por exemplo, a empresa especializada em sourcing Qwoted integrou recentemente a deteção de IA no seu fluxo de trabalho para reduzir as citações escritas por IA de «especialistas». «O futuro do jornalismo depende da confiança. É por isso que estamos muito satisfeitos com a parceria com a Pangram, que estabeleceu o padrão de excelência para a deteção e atribuição de IA.»
Pesquisadores e jornalistas também estão voltando ao redil. Críticos de longa data estão a mudar as suas opiniões e a investigar maneiras de incorporar a deteção de IA em uma política mais ampla de IA. Rob Waugh, da Press Gazette, recomendou recentemente o Pangram para usuários que desejam identificar textos gerados por IA. “Essas ferramentas não são 100% confiáveis, mas o Pangram foi classificado como preciso em comparação com outros verificadores de IA online e está integrado a serviços de resposta jornalística, como o Qwoted, para detectar argumentos e textos gerados por IA.”
Estamos interessados em discutir o seu caso de uso e se o Pangram pode ser valioso para a sua organização. Teste-nos e entre em contacto connosco para saber mais sobre as nossas ofertas empresariais.
