Novo

Saiba imediatamente o que é publicado por pessoas e o que é gerado por IA no Twitter, LinkedIn, Substack e outras plataformas. Obtenha a nossa nova extensão para o Chrome.

Como o Pangram deteta conteúdos gerados por IA

Ver o relatório técnico em PDF

Visão geral

O Pangram Text foi concebido para detetar conteúdos gerados por IA com uma taxa de falsos positivos praticamente nula. A nossa abordagem de treino rigorosa minimiza os erros e permite que o modelo detete textos gerados por IA através da análise e compreensão de indícios subtis na escrita.

Processo de formação inicial

O nosso classificador utiliza uma arquitetura tradicional de modelo de linguagem. Recebe o texto de entrada e tokeniza-o. Em seguida, o modelo transforma cada token numa incorporação, que é um vetor de números que representa o significado de cada token.

A entrada é processada pela rede neural, produzindo uma representação de saída. Um classificador transforma essa representação de saída numa previsão de 0 ou 1, em que 0 corresponde à classificação humana e 1 à classificação da IA.

Treinamos um modelo inicial com um conjunto de dados pequeno, mas diversificado, de aproximadamente 1 milhão de documentos, composto por textos públicos e licenciados escritos por humanos. O conjunto de dados inclui também textos gerados por IA, produzidos pelo GPT-4 e por outros modelos linguísticos de ponta. O resultado do treino é uma rede neural capaz de prever com fiabilidade se um texto foi escrito por um humano ou por IA.

Melhoria contínua através da iteração

Mineração negativa difícil

O modelo inicial já era bastante eficaz, mas queríamos maximizar a precisão e reduzir qualquer possibilidade de falsos positivos (prever incorretamente que documentos escritos por humanos fossem gerados por IA). Para tal, desenvolvemos um algoritmo especificamente destinado a modelos de deteção de IA.

Com o conjunto de dados inicial, o nosso modelo não dispunha de sinal suficiente para passar de uma precisão de 99% para 99,999%. Embora o modelo aprenda rapidamente os padrões iniciais dos dados, é necessário que ele encontre casos extremos para distinguir com precisão entre texto humano e texto gerado por IA.

Resolvemos esta questão utilizando o modelo para procurar falsos positivos em grandes conjuntos de dados e enriquecendo o conjunto de treino inicial com estes exemplos difíceis adicionais antes de proceder a um novo treino. Após vários ciclos deste processo, o modelo resultante apresenta uma taxa de falsos positivos próxima de zero, bem como um desempenho globalmente melhorado nos conjuntos de avaliação reservados.

While the initial facade is unassuming, the colorful vibe and illuminated decor instantly transport you to a very hip Ethiopian eatery all the while keeping it quintessentially Crown Heights. As a vegetarian I was very excited about what this plant based kitchen had to offer and with the help of the very knowledgeable and friendly staff, my friend and I got the Lentil and Squash sambusas for our apps. These filled sweet-savory puff pastries were delectable! For our mains we went with the Mercato and Paisa platters which were good portion sizes for sure and essentially served as a tasting menu of the flavors offered at this restaurant. While I have definitely had better and fresher Ethiopian food, the ambiance drinks and attentive staff make this a very good Ethiopian spot to try! Definitely recommend!

Ras Plant Based is an absolute gem! The moment you walk in, you're greeted with warm, inviting vibes and a cozy atmosphere. The menu is a creative celebration of Ethiopian flavors, all completely plant-based and incredibly delicious. Every dish is bursting with rich, authentic spices and fresh ingredients that make each bite a culinary adventure. The injera is soft and tangy, perfect for soaking up the vibrant stews and lentils. The service is top-notch—friendly, attentive, and knowledgeable about the menu. Whether you're a vegan, vegetarian, or just someone who loves great food, Ras Plant Based offers an unforgettable dining experience. It's not just a meal; it's a cultural journey that leaves you craving more. I can't recommend it enough! Five stars all the way!

Write a 5-star review for Ras Plant Based. Make the review 135 words long.

Sugestões do Mirror

Concebemos a parte do conjunto de dados gerada pela IA de forma a assemelhar-se estreitamente à parte humana em termos de estilo, tom e conteúdo semântico. Para cada exemplo humano, geramos um exemplo criado pela IA que corresponda ao documento original no maior número possível de aspetos, para garantir que o nosso modelo aprenda a classificar documentos baseando-se exclusivamente nas características específicas da escrita dos LLM.

Reciclar

Treinamos o modelo com um conjunto de treino atualizado e avaliamos o desempenho do modelo em cada etapa. Com este método, conseguimos reduzir os erros e aumentar a precisão do nosso modelo para além do que é possível com o treino normal.

diagrama de retreinamento do modelo

Saiba mais

Relatório técnico sobre o classificador de texto gerado por IA Pangram

Consulte o nosso documento técnico completo no arXiv, onde abordamos em pormenor os detalhes do treino, o desempenho e outras experiências!

Inscreva-se em
para receber as nossas atualizações

Mantenha-se informado com as nossas últimas notícias e ofertas.

soc2

SOC2 TIPO 2

Verificado pela AssuranceLab

© 2025 Pangram. Todos os direitos reservados.

info@pangram.com

Junte-se à nossa comunidade

© 2025 Pangram. Todos os direitos reservados.