¡Anunciamos una nueva colaboración con Proofig! Más información

Sí, la detección de IA puede ser precisa.

Alex Roitman
16 de septiembre de 2025

TLDR; Los académicos y moderadores de contenido deberían reconsiderar sus evaluaciones de las herramientas de detección de IA o los verificadores de IA. El consenso previo alcanzado en 2023 a partir de artículos académicos y medios de comunicación populares ha quedado obsoleto. Los últimos modelos de detección de IA, como Pangram, no solo han alcanzado el nivel de los últimos LLM, sino que se están desarrollando con vistas al futuro.

¿Cómo hemos llegado hasta aquí? Breve historia de la detección de la IA.


Cuando ChatGPT se lanzó en 2022, los escritores y creadores de contenido acudieron en masa a la nueva herramienta de inteligencia artificial para crear. Desde entonces, no ha dejado de crecer. Los creadores aprovecharon ChatGPT (y otros modelos de IA) y sus competidores para escribir de todo, desde documentos extensos, como trabajos de investigación y novelas, hasta pequeños fragmentos, como correos electrónicos, comentarios en Reddit y reseñas en Amazon. El contenido generado por IA inundó Internet. Sin embargo, desde la aparición de los LLM, ha habido una demanda para separar lo que está escrito por humanos y lo que está escrito por IA. OpenAI vio esta necesidad y creó un producto que clasificaría el texto como IA. A medida que aumentaba la adopción de la IA, crecía la demanda de detectores o clasificadores de IA, especialmente en escuelas y universidades, donde la integridad académica era primordial. Algunos estudiantes (que suelen ser los primeros en adoptar estas tecnologías) utilizaban los últimos modelos para terminar tareas, hacer exámenes y solicitar el ingreso en la universidad. Algunos investigadores, presionados por el tiempo, tomaron atajos y presentaron trabajos escritos o asistidos por IA para su publicación. Por lo tanto, se lanzaron muchas herramientas con la esperanza de abordar estas preocupaciones. Las empresas de software académico ya establecidas, como TurnItIn, lanzaron en abril de 2023 una herramienta llamada AI Checker para atender a los clientes del sector educativo. Grammarly también lanzó su propia herramienta en 2024, llamada Grammarly Authorship. La idea predominante de estas empresas era que, si sus herramientas podían identificar el plagio, también deberían identificar la IA. La educación superior, en particular, necesitaba pasar de los «verificadores de plagio» a los «verificadores de IA». Sin embargo, desde el principio quedó claro que esto no iba a funcionar.

Los primeros detectores de IA prometían precisión mediante el uso de la perplejidad y la irrupción. El director técnico de Pangram, Bradley Emi, explica estos términos:«La perplejidad es lo inesperado o sorprendente que resulta cada palabra de un texto. La irrupción es el cambio en la perplejidad a lo largo de un documento. Si hay palabras y frases sorprendentes intercaladas a lo largo del documento, entonces tiene una alta irrupción».

No nos vamos a enredar en estos términos, pero apoyarse demasiado en estos factores al crear una herramienta de detección de IA da lugar a tres defectos constantes:

  • Las herramientas a veces no son fiables para su uso en diferentes modelos como Claude, GPT-4, etc.
  • Estas herramientas no mejoran con el tiempo, por lo que las pequeñas mejoras en los LLM reducirían la precisión.
  • Clasificaron erróneamente el texto en inglés no nativo (ESL) como IA.

Estas son preocupaciones reales para las instituciones académicas en particular. El peso de acusar falsamente a estudiantes e investigadores de utilizar IA en sus estudios y trabajos es enorme. Puede arruinar carreras. Es increíblemente arriesgado confiar en herramientas con una eficacia de incluso el 95 % para filtrar la IA. Por lo tanto, muchas instituciones académicas de primer nivel, como el MIT, Vanderbilt y UC Berkeley, no apoyan que sus profesores utilicen detectores de IA. En muchos casos, citaron artículos de investigación específicos que describían el mal funcionamiento de los detectores de IA, como Testing of Detection Tools for AI-Generated Text (Prueba de herramientas de detección de texto generado por IA), y artículos del sector, como Why AI writing detectors don't work (Por qué los detectores de escritura con IA no funcionan).

OpenAI consideró estos problemas tan difíciles que abandonó su clasificador de texto basado en IA en julio de 2023, alegando que «el clasificador de IA ya no está disponible debido a su baja tasa de precisión». Muchos administradores escolares llegaron a la conclusión de que, si OpenAI no podía hacerlo, probablemente fuera imposible.

Mientras que las principales universidades y el público en general llegaron al consenso de que la promesa de la detección de IA era imposible o incluso una estafa, empresas como Pangram Labs lograron mejoras significativas en este ámbito que convierten a la detección de IA en una herramienta clave en entornos universitarios y empresariales.

Por qué la detección de IA será diferente en 2025

La detección de IA se suele describir como una carrera armamentística entre los estudiantes que buscan atajos y los educadores que intentan filtrar lo que está escrito por humanos y lo que no. En 2025, los detectores han subido el listón.

En agosto de 2025, dos investigadores de Chicago Booth, Brian Jabarian y Alex Emi, publicaron un artículo titulado Escritura artificial y detección automatizada, en el que afirmaban que «la mayoría de los detectores de IA comerciales funcionan muy bien, y Pangram, en particular, alcanza unas tasas de falsos positivos y falsos negativos cercanas a cero». Destacan que Pangram es «el único detector que cumple con un estricto límite (tasas de falsos positivos ≤ 0,005) sin comprometer la capacidad de detectar con precisión el texto generado por IA». Este es un ejemplo de lo mucho que ha avanzado la detección de IA en pocos años. Pero, ¿cómo ha sido posible?

En primer lugar, los investigadores en IA han mejorado los conjuntos de datos recopilando una gama más amplia de textos humanos y textos generados por IA. Esto incluye no solo artículos académicos, sino también otros escritos, como correos electrónicos y artículos. En segundo lugar, los desarrolladores han empleado el aprendizaje activo para reducir las tasas de falsos positivos. Esto significa que buscan los textos más difíciles de clasificar como IA o humanos y luego los reintegran en sus modelos.

Y en la carrera armamentística, los creadores de IA genérica no han respondido lo suficiente como para romper algunos detectores de IA. Cuando se lanzó el tan publicitado GPT-5 de OpenAI, prometía reducir las alucinaciones, mejorar el tono y ofrecer una escritura más creativa. En menos de 12 horas, el cofundador de Pangram Labs, Max Spero, publicó en LinkedIn que, sin necesidad de formación adicional, la herramienta de detección de IA de Pangram podía clasificar las pruebas de GPT-5 a un ritmo similar al de los modelos anteriores:

«Pangram es el único detector de IA capaz de detectar GPT-5 de forma fiable sin haber sido entrenado explícitamente para ello».

Las instituciones se están adaptando a la nueva realidad.

Existen preocupaciones genuinas sobre el uso de los detectores de IA. Muchos de ellos siguen teniendo tasas alarmantes de falsos positivos y anuncian falsamente su precisión. Sin embargo, algunas de las últimas tecnologías son increíblemente fiables y se están integrando activamente en empresas y universidades. Por ejemplo, la empresa de contratación de expertos Qwoted ha integrado recientemente la detección de IA en su flujo de trabajo para reducir las citas escritas por IA de «expertos». «El futuro del periodismo depende de la confianza. Por eso estamos encantados de asociarnos con Pangram, que ha establecido el estándar de referencia para la detección y atribución de IA».

Los investigadores y periodistas también están volviendo al redil. Los críticos de larga data están cambiando sus opiniones previas e investigando formas de incorporar la detección de IA en una política de IA más amplia. Rob Waugh, de Press Gazette, recomendó recientemente Pangram a los usuarios que desean detectar textos generados por IA. «Estas herramientas no son 100 % fiables, pero Pangram ha sido calificada como precisa en comparación con otros verificadores de IA en línea, y está integrada en servicios de respuesta periodística como Qwoted para detectar propuestas y textos generados por IA».

Nos interesa conocer su caso de uso y saber si Pangram podría ser útil para su organización. Pruébenos y póngase en contacto con nosotros para conocer nuestras ofertas para empresas.

Suscríbase a nuestro boletín informativo
Compartimos actualizaciones mensuales sobre nuestra investigación en detección de IA.