Anunciamos uma nova parceria com a Proofig! Saiba mais

Como o Pangram se compara ao GPTZero?

Bradley Emi
22 de janeiro de 2026

O mercado de deteção de IA hoje é composto por vários grandes players. Talvez já tenha ouvido falar deles: Pangram, GPTZero, Turnitin, ZeroGPT e outros.

Muitas dessas empresas atualizam regularmente os seus modelos e publicam números sobre o seu desempenho. Recentemente, a GPTZero lançou uma atualização do modelo de verão e divulgou novos números sobre o seu desempenho em vários modelos novos. Nesta publicação do blogue, iremos comparar o desempenho do novo modelo da GPTZero com a deteção de IA da Pangram, incluindo os modelos GPT-5 mais recentes.

Pangram vs. GPTZero: Números publicados

ModeloTaxa de deteção de pangramasTaxa de deteção do GPTZeroDetector melhor
GPT-599.81%95.0%Pangrama
GPT-5-chat-mais recente99.97%Não testadoN/A
GPT-5-mini99.92%92.2%Pangrama
GPT-5-nano99.97%96.1%Pangrama
GPT-OSS-120b100.00%Não testadoN/A
GPT-OSS-20b99.74%Não testadoN/A
GPT4.199.48%96.8%Pangrama
GPT4.1-mini99.94%98.7%Pangrama
o399.86%89.9%Pangrama
o3-mini100.00%98.4%Pangrama
Gemini 2.5 Pro99.91%95.7%Pangrama
Gemini 2.5 Flash99.75%98.2%Pangrama
Claude Soneto 499.91%99.1%Pangrama

Nota: O GPTZero não divulga publicamente os seus conjuntos de dados de avaliação interna, pelo que estes números não provêm exatamente dos mesmos documentos. Além disso, o GPTZero não divulga o número de documentos que testa, pelo que também não podemos comparar a quantidade. No entanto, para os números de desempenho do Pangram, avaliámos milhares de documentos por modelo, bem como uma grande variedade de domínios e esquemas de prompt para simular a utilização no mundo real.

Além disso, a precisão do Pangram não se limita a sinalizar a maioria dos documentos gerados por IA. O Pangram também é líder de mercado em manter baixas taxas de falsos positivos. É uma prioridade séria para nós não sinalizar documentos escritos por humanos como gerados por IA. Abaixo está descrita a diferença entre as taxas de falsos positivos relatadas para o Pangram e o GPTZero:

PangramaGPTZero
Taxa de falsos positivos (%)0.01%1%
Taxa de falsos positivos (#)~1 em cada 10.000 documentos~1 em cada 100 documentos

Taxa de falsos positivos do GPTZero Publicação no blog

Aqui vemos o desempenho do GPTZero relatando uma Taxa de Falsos Positivos (FPR) de 1%.

O que a pesquisa mostra? Pangram vs. GPTZero

Pangram e GPTZero também se enfrentaram em artigos de investigação sobre IA revisados por pares. Isso é melhor representado no recente estudo da Universidade de Maryland intitulado “Pessoas que usam frequentemente o ChatGPT para tarefas de escrita são detetores precisos e robustos de texto gerado por IA”. Este estudo investigou a capacidade de anotadores humanos especializados classificarem a diferença entre texto gerado por humanos e por IA.

Como parte do estudo, os anotadores humanos foram comparados com detectores disponíveis comercialmente e de código aberto. O Pangram teve um desempenho melhor do que cada detector humano individualmente, bem como melhor do que todas as alternativas comerciais, incluindo o GPTZero.

GPT-4oClaude
Pangrama100%100%
GPTZero100%97.6%
Anotador 196.7%100%
Anotador 296.7%100%
Anotador 386.7%80%
Anotador 490.0%96.7%
Anotador 593.3%93.3%

Desempenho multilingue

As diferenças entre o modelo principal da Pangram e o GPTZero não param por aí. Ambos os modelos são «multilíngues», o que significa que são capazes de detetar IA em vários idiomas, além do inglês. A Pangram é multilíngue em todos os 20 idiomas mais falados na Internet. O GPTZero suporta inglês, francês e espanhol. Aqui estão os idiomas em que cada modelo é testado:

IdiomaTaxa de falsos positivos (FPR) do PangramTaxa de falsos positivos (FPR) do GPTZeroTaxa de detecção da IA PangramTaxa de detecção da IA GPTZero
espanhol0.00%5.6%100.0%96.4%
Francês0.00%3.1%100.0%93.1%
Árabe0.10%Não testado100.0%Não testado
Checo0.00%Não testado99.89%Não testado
Alemão0.00%Não testado99.68%Não testado
grego0.00%Não testado99.79%Não testado
persa0.00%Não testado100.0%Não testado
Hindi0.00%Não testado99.58%Não testado
húngaro0.10%Não testado99.05%Não testado
italiano0.00%Não testado100.0%Não testado
japonês0.00%Não testado100.0%Não testado
holandês0.10%Não testado100.0%Não testado
Polaco0.00%Não testado100.0%Não testado
Português0.00%Não testado100.0%Não testado
romeno0.10%Não testado100.0%Não testado
russo0.00%Não testado100.0%Não testado
Sueco0.00%Não testado99.89%Não testado
turco0.00%Não testado99.79%Não testado
ucraniano0.00%Não testado99.89%Não testado
Urdu0.00%Não testado98.84%Não testado
vietnamita0.00%Não testado99.89%Não testado
chinês0.00%Não testado99.89%Não testado

Para mais informações sobre o desempenho do Pangram em textos multilingues, consulte esta publicação no blogue.

Desempenho em ESL

Além disso, ambos os modelos são treinados com muita atenção ao desempenho em ESL, pois existe um receio generalizado de que os detetores de IA possam ser tendenciosos em relação a falantes não nativos de inglês. Tanto o GPTZero quanto o Pangram publicaram resultados específicos sobre textos em ESL. Veja abaixo como eles se comparam:

Taxa de falsos positivosTamanho da amostra
Pangrama0.032%25,021
GPTZero1.1%91

Para ler mais sobre a abordagem da Pangram ao texto ESL, consulte esta publicação no blogue https://www.pangram.com/blog/how-accurate-is-pangram-ai-detection-on-esl

Modelos não lançados e GPT-5

Outra preocupação para quem está no mercado de detecção de IA é o desempenho em modelos ainda não lançados. À medida que a guerra da IA continua a se expandir, grandes laboratórios de IA e pequenas empresas emergentes lançam modelos importantes regularmente. É importante que uma solução de detecção de IA continue a fornecer resultados precisos em modelos nos quais talvez não tenha sido possível treinar diretamente.

O recente lançamento do GPT-5 proporcionou uma excelente oportunidade para descobrir isso! Poucas horas após o lançamento do novo modelo, a equipa do Pangram testou o desempenho do GPTZero e do Pangram em vários tipos de prompts. Veja como eles se saíram:

PangramaGPTZero
Documento 1100%2%
Documento 2100%0%
Documento 3100%0%
Documento 4100%0%
Documento 5100%9%
Documento 699%0%
Documento 7100%0%
Documento 8100%0%
Documento 9100%29%
Documento 10100%0%
Documento 11100%10%

Nota: A GPTZero lançou uma atualização do modelo que afirma ter um desempenho melhor no GPT-5! Para mais detalhes sobre a nossa comparação original, consulte esta publicação no blogue. Além disso, incentivamos os utilizadores a realizar os seus próprios testes para comparar o desempenho em qualquer momento.

Conclusão

No final das contas, o Pangram continua a ser a escolha robusta e confiável para detectar conteúdo gerado por IA. Seja para educação, publicação, moderação de conteúdo ou algo ainda mais específico, estamos aqui para oferecer uma detecção de IA precisa e justa. Saiba mais no nosso blog ou entre em contacto pelo e-mail info@pangram.com.

Inscreva-se na nossa newsletter
Partilhamos atualizações mensais sobre a nossa investigação em deteção de IA.