modelo

Pangram 3.2

February 27, 2026

Katherine Thai · Elyas Masrour · Max Spero · Bradley Emi

Descripción del modelo

Pangram 3.2 is an AI detection model released by Pangram Labs on February 25, 2026. It is the successor to Pangram 3.1, with incremental improvements on recall at the same state-of-the-art false positive rate as its predecessor.

Pangram 3.2 is also better able to classify shorter texts of 50-75 words than Pangram 3.1.

As with all Pangram 3 series models, it uses technology from the EditLens technical report.

Entradas y salidas

Entradas

Pangram 3.2 can receive text inputs of 50 words minimum up to 75,000 characters in length. The minimum of 50 words is lower than the previous minimum of 75 words for Pangram 3.1.

Segment Level Outputs

Pangram 3.2 emits both document level and segment level predictions. The model splits input text into an array of segmentas, which are individual chunks or windows of text within the document. Each segment returns one of the following predictions:

etiqueta (Clasificación discreta)

Uno de los siguientes: generado por IA, moderadamente asistido por IA, ligeramente asistido por IA o escrito por humanos.

puntuación_de_asistencia_ai (Flotar)

Una puntuación entre 0,0 y 1,0 que indica el nivel de participación de la IA, donde 0,0 significa que no hay asistencia de la IA y 1,0 significa que está generado íntegramente por la IA.

confianza (Clasificación discreta)

El nivel de confianza del modelo para esta clasificación (alto, medio o bajo).

Document Level Outputs

These are all possible classification results that our AI detection model can return when analyzing a document.

Fully Human Written

The entire document is identified as human-written, with no AI involvement detected.

Human Written

The vast majority of the document (90% or more) is identified as human-written. A small portion appears to have been refined or polished with the help of AI tools, but no directly AI-generated content is detected.

Mostly Human Written

The vast majority of the document (90% or more) is identified as human-written, but a small amount of AI-generated content is detected.

Generado íntegramente por IA

The entire document is identified as AI-generated, with no human-written content detected.

AI Assisted

This result is returned in several scenarios where the document shows signs of AI assistance rather than direct AI generation. These include documents that are entirely composed of lightly AI-assisted content, entirely composed of moderately AI-assisted content, or a combination of different levels of AI assistance. It also applies when the document contains a mix of AI-assisted and human-written content without any directly AI-generated passages, or when the document is predominantly AI-assisted with some human writing present.

AI Detected

This result indicates that directly AI-generated content has been identified in the document. It applies across a range of scenarios, including documents that are predominantly AI-generated with some human-written or AI-assisted content, documents that are mostly human-written but contain some AI-generated passages, and documents that contain a blend of AI-generated, AI-assisted, and human-written content in varying proportions.

Mostly Human, AI Detected

The document is primarily human-written (at least 70%), but some AI-generated content is detected. In some cases, AI-assisted content may also be present alongside the AI-generated portions.

Mostly Human, AI Assisted

The document is primarily human-written (at least 70%), and while no directly AI-generated content is found, some portions appear to have been created with the assistance of AI tools.

Resolución modelo

Pangram 3.2 is accurate to a resolution of approximately 50 words. This means that shorter segments of human text interspersed with AI text may be classified as AI assisted, but Pangram will not be able to distinguish the human and AI parts at the word- or sentence-level.

Idiomas admitidos

Inglés Español Francés Portugués Árabe Chino Japonés Coreano Noruego Ruso Turco Húngaro Alemán Holandés Sueco Rumano Ucraniano Polaco Italiano Checo Griego Hindi

Pangram puede funcionar eficazmente en idiomas fuera del conjunto de idiomas oficialmente compatibles gracias a la generalización de la estructura LLM. Póngase en contacto con nosotros para solicitar una evaluación en otros idiomas fuera del conjunto de idiomas oficialmente compatibles.

Formación de modelos

Conjuntos de datos de entrenamiento

No change from Pangram 3.1.

Arquitectura

Pangram 3.2 has the same architecture as Pangram 3.1, except we have reduced the context window to 512 tokens. The tokenizer is a standard multilingual tokenizer.

We do not trade off false positives and false negatives. We calibrate our model such that the false positive rate is equivalent to that of our previous release.

Hardware Entrenado durante 3 días en 8 GPU NVIDIA H100.

Software Entrenado utilizando las bibliotecas PyTorch y HuggingFace.

Inferencia del modelo

Preprocesamiento

No change from Pangram 3.1.

Inferencia

Pangram 3.2 uses the Adaptive Boundaries algorithm described in our Pangram 3.1 model card.

Postprocesamiento

No change from 3.1.

Latencia de inferencia

No change from 3.1.

Evaluaciones

Metodología

  • +

    Evaluación del conjunto de pruebas dentro del dominio: ejemplos excluidos de los mismos conjuntos de datos utilizados para el entrenamiento, útiles para comprender el ajuste del modelo.

  • +

    Evaluación fuera del dominio: fuentes y dominios completamente excluidos, útiles para comprender la generalización.

  • +

    Puntos de referencia externos: útiles para comparaciones sobre el terreno, pero no deben considerarse fiables como medida actual una vez publicados, ya que los puntos de referencia pueden entrenarse fácilmente.

Conjuntos de datos humanos — Tasa de falsos positivos

Conjunto de datosFPRN
Redacción académica (inglés)0.02%62,971
Redacción académica, traducido por Google0.00%600
Reseñas de Amazon (multilingües)0.00%10,425
Noticias (multilingüe)0.35%100,119
Escritura creativa, formato largo, inglés0.00%10,495
Poesía0.54%12,769
Artículos de investigación biomédica0.01%65,053
Artículos prácticos, multilingües0.17%166,194
Documentación de AWS0.00%11,652
Discursos0.19%1,058
Guiones de películas0.00%9,989
Recetas0.05%22,421

Conjuntos de datos de IA por dominio: tasa de falsos negativos

Conjunto de datosFNRN
Redacción académica0.00%48,443
Escritura creativa0.24%41,940
Chatbot Arena, muestra aleatoria1.98%2,536

Puntos de referencia de terceros

Conjunto de datosPrecisiónFPRFNRN
Liang et al. (2023): Inglés no nativo100%0%91
Russell et al. (2024): Detectores humanos100%0%0%300
Dugan et al. (2024): RAID, Random Sample99.43%0.07%0.90%66,855

Changes from Pangram 3.1

  • +Updated the model to detect Claude 4.6.
  • +Improved recall, particularly on humanized texts.
  • +Lowered minimum word count from 75 to 50.

Uso previsto y limitaciones

Pangram 3.2 is intended to be used on long-form writing samples in complete sentences.

Las listas con viñetas, las instrucciones y los manuales técnicos, los índices, las secciones de referencia, la redacción basada en plantillas o automatizada y las ecuaciones matemáticas densas son más susceptibles de generar falsos positivos que otros ámbitos.

Para obtener los mejores resultados, se deben eliminar las instrucciones escritas por humanos, los encabezados, los pies de página y otros formatos superfluos antes de comprobar el texto generado por IA.

Debido a posibles errores en el analizador de PDF, se recomienda utilizar archivos de texto sin formato y archivos .docx como formatos de archivo de entrada en lugar de PDF, siempre que sea posible.

Ética y seguridad

Las acusaciones falsas sobre el uso de la IA pueden acarrear graves consecuencias, como daños a la reputación, traumas emocionales y otros perjuicios indebidos.

Reconocemos que nuestro modelo tiene una tasa de error distinta de cero y que sus errores pueden provocar tales daños. Nos comprometemos a seguir colaborando con nuestros usuarios y la comunidad académica para educar a otros sobre cómo contextualizar y comunicar adecuadamente los resultados del software de detección de IA.

Nos tomamos muy en serio las denuncias de falsos positivos y trabajamos para mitigar su aparición en la medida de las posibilidades de nuestro equipo.

Nos comprometemos a entrenar y lanzar modelos con la menor tasa de falsos positivos posible, y a mejorar nuestras evaluaciones para seguir probando y supervisando exhaustivamente las futuras versiones de los modelos en busca de regresiones.

Pangram Labs — Model Card for Pangram 3.2