modelo
Pangram 3.2
February 27, 2026Katherine Thai · Elyas Masrour · Max Spero · Bradley Emi
Descripción del modelo
Pangram 3.2 is an AI detection model released by Pangram Labs on February 25, 2026. It is the successor to Pangram 3.1, with incremental improvements on recall at the same state-of-the-art false positive rate as its predecessor.
Pangram 3.2 is also better able to classify shorter texts of 50-75 words than Pangram 3.1.
As with all Pangram 3 series models, it uses technology from the EditLens technical report.
Entradas y salidas
Entradas
Pangram 3.2 can receive text inputs of 50 words minimum up to 75,000 characters in length. The minimum of 50 words is lower than the previous minimum of 75 words for Pangram 3.1.
Segment Level Outputs
Pangram 3.2 emits both document level and segment level predictions. The model splits input text into an array of segmentas, which are individual chunks or windows of text within the document. Each segment returns one of the following predictions:
Uno de los siguientes: generado por IA, moderadamente asistido por IA, ligeramente asistido por IA o escrito por humanos.
Una puntuación entre 0,0 y 1,0 que indica el nivel de participación de la IA, donde 0,0 significa que no hay asistencia de la IA y 1,0 significa que está generado íntegramente por la IA.
El nivel de confianza del modelo para esta clasificación (alto, medio o bajo).
Document Level Outputs
These are all possible classification results that our AI detection model can return when analyzing a document.
Fully Human Written
The entire document is identified as human-written, with no AI involvement detected.
Human Written
The vast majority of the document (90% or more) is identified as human-written. A small portion appears to have been refined or polished with the help of AI tools, but no directly AI-generated content is detected.
Mostly Human Written
The vast majority of the document (90% or more) is identified as human-written, but a small amount of AI-generated content is detected.
Generado íntegramente por IA
The entire document is identified as AI-generated, with no human-written content detected.
AI Assisted
This result is returned in several scenarios where the document shows signs of AI assistance rather than direct AI generation. These include documents that are entirely composed of lightly AI-assisted content, entirely composed of moderately AI-assisted content, or a combination of different levels of AI assistance. It also applies when the document contains a mix of AI-assisted and human-written content without any directly AI-generated passages, or when the document is predominantly AI-assisted with some human writing present.
AI Detected
This result indicates that directly AI-generated content has been identified in the document. It applies across a range of scenarios, including documents that are predominantly AI-generated with some human-written or AI-assisted content, documents that are mostly human-written but contain some AI-generated passages, and documents that contain a blend of AI-generated, AI-assisted, and human-written content in varying proportions.
Mostly Human, AI Detected
The document is primarily human-written (at least 70%), but some AI-generated content is detected. In some cases, AI-assisted content may also be present alongside the AI-generated portions.
Mostly Human, AI Assisted
The document is primarily human-written (at least 70%), and while no directly AI-generated content is found, some portions appear to have been created with the assistance of AI tools.
Resolución modelo
Pangram 3.2 is accurate to a resolution of approximately 50 words. This means that shorter segments of human text interspersed with AI text may be classified as AI assisted, but Pangram will not be able to distinguish the human and AI parts at the word- or sentence-level.
Idiomas admitidos
Pangram puede funcionar eficazmente en idiomas fuera del conjunto de idiomas oficialmente compatibles gracias a la generalización de la estructura LLM. Póngase en contacto con nosotros para solicitar una evaluación en otros idiomas fuera del conjunto de idiomas oficialmente compatibles.
Formación de modelos
Conjuntos de datos de entrenamiento
No change from Pangram 3.1.
Arquitectura
Pangram 3.2 has the same architecture as Pangram 3.1, except we have reduced the context window to 512 tokens. The tokenizer is a standard multilingual tokenizer.
We do not trade off false positives and false negatives. We calibrate our model such that the false positive rate is equivalent to that of our previous release.
Hardware Entrenado durante 3 días en 8 GPU NVIDIA H100.
Inferencia del modelo
Preprocesamiento
No change from Pangram 3.1.
Inferencia
Pangram 3.2 uses the Adaptive Boundaries algorithm described in our Pangram 3.1 model card.
Postprocesamiento
No change from 3.1.
Latencia de inferencia
No change from 3.1.
Evaluaciones
Metodología
- +
Evaluación del conjunto de pruebas dentro del dominio: ejemplos excluidos de los mismos conjuntos de datos utilizados para el entrenamiento, útiles para comprender el ajuste del modelo.
- +
Evaluación fuera del dominio: fuentes y dominios completamente excluidos, útiles para comprender la generalización.
- +
Puntos de referencia externos: útiles para comparaciones sobre el terreno, pero no deben considerarse fiables como medida actual una vez publicados, ya que los puntos de referencia pueden entrenarse fácilmente.
Conjuntos de datos humanos — Tasa de falsos positivos
| Conjunto de datos | FPR | N |
|---|---|---|
| Redacción académica (inglés) | 0.02% | 62,971 |
| Redacción académica, traducido por Google | 0.00% | 600 |
| Reseñas de Amazon (multilingües) | 0.00% | 10,425 |
| Noticias (multilingüe) | 0.35% | 100,119 |
| Escritura creativa, formato largo, inglés | 0.00% | 10,495 |
| Poesía | 0.54% | 12,769 |
| Artículos de investigación biomédica | 0.01% | 65,053 |
| Artículos prácticos, multilingües | 0.17% | 166,194 |
| Documentación de AWS | 0.00% | 11,652 |
| Discursos | 0.19% | 1,058 |
| Guiones de películas | 0.00% | 9,989 |
| Recetas | 0.05% | 22,421 |
Conjuntos de datos de IA por dominio: tasa de falsos negativos
| Conjunto de datos | FNR | N |
|---|---|---|
| Redacción académica | 0.00% | 48,443 |
| Escritura creativa | 0.24% | 41,940 |
| Chatbot Arena, muestra aleatoria | 1.98% | 2,536 |
Puntos de referencia de terceros
| Conjunto de datos | Precisión | FPR | FNR | N |
|---|---|---|---|---|
| Liang et al. (2023): Inglés no nativo | 100% | 0% | — | 91 |
| Russell et al. (2024): Detectores humanos | 100% | 0% | 0% | 300 |
| Dugan et al. (2024): RAID, Random Sample | 99.43% | 0.07% | 0.90% | 66,855 |
Changes from Pangram 3.1
- +Updated the model to detect Claude 4.6.
- +Improved recall, particularly on humanized texts.
- +Lowered minimum word count from 75 to 50.
Uso previsto y limitaciones
Pangram 3.2 is intended to be used on long-form writing samples in complete sentences.
Las listas con viñetas, las instrucciones y los manuales técnicos, los índices, las secciones de referencia, la redacción basada en plantillas o automatizada y las ecuaciones matemáticas densas son más susceptibles de generar falsos positivos que otros ámbitos.
Para obtener los mejores resultados, se deben eliminar las instrucciones escritas por humanos, los encabezados, los pies de página y otros formatos superfluos antes de comprobar el texto generado por IA.
Debido a posibles errores en el analizador de PDF, se recomienda utilizar archivos de texto sin formato y archivos .docx como formatos de archivo de entrada en lugar de PDF, siempre que sea posible.
Ética y seguridad
Las acusaciones falsas sobre el uso de la IA pueden acarrear graves consecuencias, como daños a la reputación, traumas emocionales y otros perjuicios indebidos.
Reconocemos que nuestro modelo tiene una tasa de error distinta de cero y que sus errores pueden provocar tales daños. Nos comprometemos a seguir colaborando con nuestros usuarios y la comunidad académica para educar a otros sobre cómo contextualizar y comunicar adecuadamente los resultados del software de detección de IA.
Nos tomamos muy en serio las denuncias de falsos positivos y trabajamos para mitigar su aparición en la medida de las posibilidades de nuestro equipo.
Nos comprometemos a entrenar y lanzar modelos con la menor tasa de falsos positivos posible, y a mejorar nuestras evaluaciones para seguir probando y supervisando exhaustivamente las futuras versiones de los modelos en busca de regresiones.
Pangram Labs — Model Card for Pangram 3.2
