Question 1

What data did you train your model on?

Accepted Answer

O nosso modelo foi treinado com base num conjunto de dados diversificado e exclusivo, composto por milhões de pares de documentos redigidos por humanos e por IA. Recorremos à aprendizagem ativa para abordar casos extremos e, em particular, reduzir o preconceito contra autores cuja língua materna não é o inglês.

Question 2

How do I interpret the API results?

Accepted Answer

A API devolve uma pontuação de previsão (entre 0,0 e 1,0) e uma etiqueta categórica. Os pontos de extremidade avançados oferecem uma análise ao nível da janela para visualizar a «irregularidade» e os padrões sintáticos ao longo do documento.

Question 3

Are you storing data from API calls?

Accepted Answer

Não. Para clientes empresariais, oferecemos garantias de retenção zero, em que os dados são processados na memória e eliminados imediatamente após a análise, para garantir a privacidade.

Question 4

Can Pangram detect text from the latest AI models?

Accepted Answer

Sim. Estamos constantemente a retreinar o nosso classificador com os resultados dos novos modelos de ponta (como o Gemini Ultra e o GPT-4) poucos dias após o seu lançamento.

Question 5

How does Pangram handle adversarial attacks or "humanized" text?

Accepted Answer

Os nossos modelos são treinados especificamente para lidar com ataques adversários e «humanizadores» que tentam ofuscar texto sintético. Ao utilizar a mineração de exemplos negativos rigorosos durante o treino, minimizamos os falsos positivos em textos humanos com um estilo formal.

Question 6

Can I integrate this directly into my automated data pipelines?

Accepted Answer

Sim. Pode instalar o pangram-sdk para integrar a deteção em pipelines do Airflow ou do Databricks com apenas algumas linhas de código. A nossa API está otimizada para operações de scraping empresariais de alto rendimento, suportando milhões de pedidos com baixa latência.

Question 7

How does Pangram distinguish between AI-generated content and human-edited "mixed" content?

Accepted Answer

Ao contrário dos detetores binários, o Pangram fornece probabilidades ao nível dos tokens. Esta interpretabilidade granular permite-lhe identificar e reter segmentos editados por humanos, ao mesmo tempo que filtra o «conteúdo de baixa qualidade» totalmente sintético dos seus conjuntos de dados de treino.

Question 8

What is the primary benefit for LLM training and data selection?

Accepted Answer

A utilização do Pangram ajuda a evitar o colapso dos modelos. Ao filtrar o conteúdo recursivo gerado por IA dos seus fluxos de trabalho de scraping, mantém a pureza do corpus e garante que os seus modelos não sofrem uma degradação no desempenho ou na diversidade devido ao treino com dados de má qualidade.

Detetor de IA para engenheiros de aprendizagem automática e cientistas de dados

Não treine os seus modelos
com dados de má qualidade.

Evitar o colapso do modelo

Verificar entradas do RLHF

Interpretabilidade granular

Um modelo em que pode confiar

Mineração negativa difícil

Robustez adversarial

Preparação para o futuro

Concebido para o seu pipeline de dados do

Perguntas frequentes sobre detecção de IA

Com que dados treinou o seu modelo?

Como devo interpretar os resultados da API?

Está a armazenar dados de chamadas à API?

O Pangram consegue reconhecer texto gerado pelos modelos de IA mais recentes?

Como é que o Pangram lida com ataques adversários ou com texto «humanizado»?

Posso integrar isto diretamente nos meus fluxos de dados automatizados?

Como é que o Pangram distingue entre conteúdo gerado por IA e conteúdo «misto» editado por humanos?

Qual é a principal vantagem da formação em LLM e da seleção de dados?

Detecção de IA para
todas as organizações

Para programadores

Para moderação de conteúdo

Para universidades

Limpe os seus dados de treino hoje mesmo