Novo

Saiba imediatamente o que é publicado por pessoas e o que é gerado por IA no Twitter, LinkedIn, Substack e outras plataformas. Obtenha a nossa nova extensão para o Chrome.

Saiba mais
Atualizações do produto

O Pangram Text AI Detector agora é multilíngue!

1 de julho de 2024

Foto de Valentin Antonucci.Foto de Valentin Antonucci.

Temos o prazer de anunciar uma grande atualização do Pangram Text, o nosso principal modelo de deteção de IA. O Pangram Text agora consegue detetar textos gerados por IA em espanhol, francês, italiano, português, alemão, russo e mandarim, com a mesma precisão líder do setor que os textos escritos em inglês. Estamos a lançar o nosso novo modelo multilingue para proteger imediatamente as plataformas online contra spam de IA.

Avaliação comparativa

Para testar a precisão do nosso modelo em idiomas diferentes do inglês, utilizamos três corpora multilíngues grandes e diversificados de diferentes domínios: avaliações multilíngues da Amazon, Wikipedia e XLSum (BBC News International).

Para o lado humano do benchmark, selecionamos documentos aleatórios que passam pelos nossos filtros de verificação de sanidade. Para o lado da IA do benchmark, usamos uma combinação de GPT-3.5, GPT-4 e GPT-4o. Primeiro, pedimos ao LLM para resumir o documento real, por exemplo, «Sobre o que é esta crítica?» Em seguida, pedimos que ele gere uma crítica, artigo ou notícia com base no resumo. Gerar o benchmark dessa forma elimina a possibilidade de ruído de rótulo, além de garantir que as distribuições de dados humanos e de IA sejam o mais semelhantes possível entre si.

IdiomaPrecisão das avaliações da AmazonPrecisão da WikipédiaXLSum (BBC News) Precisão
espanhol99.59%99.75%99.75%
Francês98.84%99.33%98.50%
italianoN/A99.82%N/A
Alemão99.44%99.95%N/A
PortuguêsN/A99.83%99.70%
russoN/A98.34%99.35%
chinês99.70%99.54%98.10%

Perguntas frequentes

  • Como atualizou o modelo para suportar esses idiomas?

Como o nosso modelo se baseia numa arquitetura semelhante aos modelos linguísticos modernos de grande dimensão, utilizamos pré-treinamento em grande escala para garantir que a nossa estrutura seja treinada num grande corpus multilíngue antes de ajustar um cabeçalho de detecção de IA. Também utilizamos um tokenizador que suporta vários idiomas, incluindo russo e chinês.

  • Por que escolheu essas línguas específicas?

Escolhemos idiomas que representam a maioria dos idiomas usados na Internet.

  • O que acontece se eu enviar um texto num idioma que não é suportado?

Utilizamos o Amazon Comprehend para detetar o idioma do texto inserido. Se o idioma não for suportado, retornaremos "Idioma não suportado" como previsão.

  • O modelo irá melhorar com o tempo?

Sim, esperamos lançar atualizações futuras com desempenho melhorado em idiomas que não sejam o inglês, à medida que continuamos a aumentar o nosso conjunto de dados multilingues com aprendizagem ativa.

  • E quanto a outros idiomas?

Planeamos oferecer suporte a mais idiomas no futuro. Se tem algum idioma que gostaria que fosse suportado, informe-nos!

Entre em contacto connosco pelo e-mail info@pangram.com para obter mais informações sobre a deteção multilingue por IA.


Bradley Emi
Bradley EmiDiretor de Tecnologia, Cofundador

Bradley é pesquisador de IA e especialista na criação de produtos de aprendizagem profunda na indústria. Recentemente, ele liderou o grupo de pesquisa de aprendizagem profunda na Absci, uma empresa de descoberta de medicamentos com IA generativa, e anteriormente foi membro da equipa principal de visão computacional da Tesla Autopilot.

Enquanto estudante de pós-graduação, Bradley foi autor de várias publicações sobre pesquisa em deep learning com o Stanford Vision Lab. Ele é bacharel em Física e mestre em Inteligência Artificial pela Universidade de Stanford. Além de IA, ele também se interessa por educação, filosofia e é um ávido jogador de golfe.

Mais de Bradley Emi

Leitura relacionada

Os detetores de IA funcionam contra o GPT-5?
Atualizações do produto

Os detetores de IA funcionam contra o GPT-5?

7 de agosto de 2025
Atualização do texto Pangram: GPT-4o, Claude 3, LLaMA 3
Atualizações do produto

Atualização do texto Pangram: GPT-4o, Claude 3, LLaMA 3

22 de maio de 2024
Relatório técnico sobre detecção de texto gerado por IA com alta precisão
Atualizações do produto

Relatório técnico sobre detecção de texto gerado por IA com alta precisão

21 de fevereiro de 2024
Conheça o Pangram 3.3!
Atualizações do produto

Conheça o Pangram 3.3!

13 de maio de 2026
O Pangram funciona no GPT-5.4?
Atualizações do produto

O Pangram funciona no GPT-5.4?

6 de março de 2026
Anunciando a identificação por IA: o Pangram consegue distinguir os diferentes LLMs uns dos outros
Atualizações do produto

Anunciando a identificação por IA: o Pangram consegue distinguir os diferentes LLMs uns dos outros

11 de fevereiro de 2025