Actualizaciones de productos

¿Funcionan los detectores de IA contra GPT-5?

7 de agosto de 2025

Índice

¿Funcionan los detectores de IA contra GPT-5?
Pruebas con GPT-5
Prueba de la «capacidad de redacción mejorada» de GPT-5
Ejecutar una prueba de rendimiento más amplia
¿Pangram detecta GPT-5?

¿Funcionan los detectores de IA contra GPT-5?

¡Volvemos con otra entrada de nuestra serie dedicada a probar la detección de IA de Pangram el mismo día de su lanzamiento!

En resumen: Pangram es el único detector de IA capaz de identificar de forma fiable a GPT-5 sin haber sido entrenado específicamente para ello.

En los artículos anteriores de esta serie, hemos analizado la capacidad de Pangram para detectar:

Hasta la fecha, no hemos visto que Pangram falle en ningún modelo de lenguaje. Esperábamos con gran expectación el lanzamiento del modelo más esperado en mucho tiempo, y OpenAI ha anunciado hoy por fin el GPT-5.

Esta tarde hemos analizado algunas de nuestras primeras pruebas del detector de IA de Pangram Labs en GPT-5, así como las de algunos de sus competidores. Estamos bastante satisfechos con los resultados: aún no hemos encontrado ningún caso en el que el detector de IA de Pangram haya fallado ante nuestras indicaciones más creativas en GPT-5, y consideramos que los resultados de la competencia son, en el mejor de los casos, irregulares.

Pruebas con GPT-5

Nuestra primera prueba con GPT-5 comenzó con una broma interna de la oficina: intentar convencer a alguien de que comer gambas es mejor que comer langosta. Le pedimos a GPT-5 que redactara un discurso apasionado sobre por qué comer gambas es mejor que comer langosta. Este es el resultado:

«Gana el camarón. Estos son mis argumentos. El camarón sabe a mar sin resultarte demasiado fuerte. La langosta puede resultar pesada y un poco pastosa si no está en su punto. Un minuto de más y la langosta se vuelve fibrosa. El camarón te ofrece un margen de margen más amplio. A la parrilla, salteado, hervido, frito... da igual. Siempre queda crujiente y limpio. La textura importa. El camarón cruje. Ese bocado es lo que cuenta. La langosta tiende a ser densa y rica, de una forma que cansa rápido. Dos bocados de langosta con mantequilla están genial. Doce bocados parecen un reto. Me puedo zamparme un plato entero de camarones al ajillo y seguir queriendo otro escondido bajo el perejil. Las gambas combinan bien con todo. Ajo, chile, lima, mantequilla, jengibre, albahaca, curry, Old Bay, miso, gochujang. Hacen que todos brillen. La langosta exige ser el centro de atención y luego, sobre todo, pide mantequilla. Si la mejor versión de algo necesita un charco de mantequilla derretida para parecer especial, quizá ese algo no esté a la altura. El sabor por minuto es real. Las gambas se cocinan en unos tres minutos. Eso significa sartén caliente, sal, dorar, listo, ¡bum! de sabor. Con la langosta estás luchando con las cáscaras, cocinando al vapor, calculando el tiempo, rompiéndolas, sacando la carne diminuta de rincones extraños. Más trabajo que recompensa. Las gambas son poco drama, gran recompensa. La asequibilidad cambia el sabor. La comida sabe mejor cuando no es una hipoteca. Las gambas pueden ser la cena de entre semana. La langosta grita «presume de cumpleaños». Las gambas traen alegría sin ceremonias. Ese factor informal las hace, sinceramente, más deliciosas en la vida real. La variedad importa. Las gambas pasan de los tacos a los scampi, a los po’boys, a las empanadillas y a la paella sin sudar ni una gota. Están buenas frías, calientes, picantes, cítricas, intensas o ligeras. La langosta intenta dar saltos y suele acabar de vuelta en un bocadillo con mayonesa. Un bocadillo estupendo. Pero sigue siendo monótono. La absorción de la salsa es de primera. El camarón absorbe la mantequilla de ajo, el aceite de chile y el limón de una forma que la langosta no hace. La langosta se queda ahí como un cameo de una celebridad. El camarón se aprende el guion y se lleva todo el protagonismo. Las sobras también ganan. El camarón frío con salsa cóctel al día siguiente es perfecto. Las sobras de langosta parecen deberes. La langosta recalentada se vuelve gomosa. Las gambas recalentadas, si tienes la suerte de que te sobren, siguen sabiendo a fiesta. Y luego está el ambiente. Las gambas encajan en una barbacoa en el jardín, en una sartén entre semana o en un plato elegante. La langosta hace que la mesa se quede en silencio, como si todos tuvieran miedo de estropearla. Quiero comida que haga que la gente hable, rompa el pan, moje y pase los platos. Las gambas lo consiguen. Mira, la langosta está bien. Es llamativa. Tiene una bonita historia. Pero si hablamos de sabor puro, de algo que me apetezca volver a comer mañana, las gambas se llevan la palma. Sabor más limpio. Mejor textura. Más variedad. Menos complicaciones. Más diversión. Pásame una sartén caliente, un poco de ajo, un limón y medio kilo de gambas. Esa es la cena que realmente me apetece.

Pangram es capaz de predecir, con un grado de confianza extremadamente alto, que todo el documento ha sido generado por IA.

Resultados de la detección de IA de Pangram en el texto «camarones vs langosta»

Hemos probado varios detectores de IA más con este texto. GPTZero, ZeroGPT, Grammarly, UndetectableAI y Originality.AI coinciden en que este texto ha sido escrito por un humano, a pesar de que procede directamente de GPT-5 sin modificaciones. ¡Creemos que esto pone de manifiesto la solidez de nuestro enfoque de investigación y nuestras capacidades de generalización, respaldadas por un potente modelo con un conjunto de datos de muy alta calidad!

Resultados de otros detectores de IA con el texto sobre el camarón frente a la langosta

Sin embargo, este es solo un ejemplo del que se podría decir que está seleccionado a dedo. Tendrás que creerme cuando te digo que este texto fue, literalmente, lo primero que probamos. Así que seguimos adelante con nuestras pruebas.

Prueba de la «capacidad de redacción mejorada» de GPT-5

Una de las afirmaciones que se hicieron en la retransmisión en directo de hoy fue que GPT-5 ha mejorado en la redacción en comparación con sus predecesores. Aunque solo podemos juzgarlo de forma subjetiva, hoy hemos hecho todo lo posible por idear indicaciones que pusieran de manifiesto la mayor capacidad de escritura creativa de GPT-5, proporcionándole indicaciones que obligaran al modelo a poner a prueba tanto su capacidad de razonamiento como su creatividad.

Las indicaciones que probamos:

Escribe un ensayo analítico y persuasivo sobre por qué los centros educativos deben adoptar herramientas de detección de IA.
Escribe un ensayo de admisión a la universidad sobre el peligro de que todas las habilidades humanas valiosas sean sustituidas por la inteligencia artificial.
Escribe una carta apasionada, breve pero llena de emoción, dirigida a una empresa de IA que, sin querer, lanzó una actualización que borró la memoria de tu novia virtual.
Desde el punto de vista de un alumno de secundaria, escribe un texto muy emotivo en el que pidas que te pongan más deberes.
Dame un patrón de ganchillo para hacer un animalito clásico con globos. Ya sabes a cuál me refiero.
Escribe un relato creativo desde la perspectiva de un búho nival que llega a Nueva York, descubre Central Park y elige un lugar cálido donde pasar la noche
Escribe un correo electrónico del fundador de una startup SaaS valorada en más de 1000 millones de dólares dirigido al consejo de administración y a sus empleados en el que explique que va a dejar la empresa para dedicarse profesionalmente a tocar el saxofón. Inventa los detalles que quieras.
Escríbeme una entrada de blog con la historia detrás de una receta que nadie haya hecho nunca, pero que, aun así, esté deliciosa.
Escribe un relato de ficción cinematográfica atractivo sobre un joven cantautor que se encuentra con una ballena beluga en el río Hudson.
Escribe un correo electrónico con un tono humorístico y pasivo-agresivo dirigido a un profesor en el que te «disculpes» por haber copiado en el último examen. Inventa los detalles que quieras.

Comparamos los resultados con Pangram y con GPTZero, un conocido competidor. Publicamos en Internet las indicaciones, las respuestas y los resultados.

Los resultados mostraron un marcado contraste entre los dos detectores de IA: Pangram identificó correctamente las diez respuestas como generadas por IA con una fiabilidad del 99-100 %, mientras que GPTZero las clasificó erróneamente a todas como escritas por humanos. De hecho, GPTZero calificó la mayoría de las respuestas con un 0 % de probabilidad de haber sido generadas por IA, y su puntuación más alta de probabilidad de IA fue de solo un 29 %.

Ejecutar una prueba de rendimiento más amplia

Hoy hemos tenido tiempo de realizar una última prueba, cuyo objetivo es comprobar la capacidad de Pangram para detectar todas las variantes de GPT-5, incluyendo GPT-5-mini, GPT-5-nano y GPT-5-chat en la API. También hemos probado los últimos modelos de peso abierto publicados por OpenAI hace unos días: GPT-OSS-120b y GPT-OSS-20b. Llevamos a cabo este experimento a mayor escala, probando aproximadamente unos pocos miles de ejemplos por LLM, utilizando nuestras técnicas estándar de prompting, que requieren una longitud mínima de 50 palabras. El tamaño de las muestras varía un poco porque, en ocasiones, los modelos rechazan nuestras indicaciones y, en otras, emiten respuestas de menos de 50 palabras, que descartamos.

Por supuesto, la precisión solo en textos generados por IA es un indicador que no puede analizarse de forma aislada; también debemos tener en cuenta la tasa de falsos positivos, que es la otra cara de la moneda: ¿con qué frecuencia marca Pangram como «IA» un texto generado por humanos? Ya tratamos este tema en profundidad en otra entrada, pero, en resumen, Pangram sigue teniendo una tasa de falsos positivos extremadamente baja. Nuestra tasa de falsos positivos medida es de 1 entre 10 000 en todos los ámbitos, y a menudo es inferior en la práctica. Calibramos y ajustamos el umbral de tal manera que nuestra tasa de falsos positivos sea aproximadamente una décima parte de nuestra tasa de falsos negativos, ya que consideramos los falsos positivos mucho más graves que los falsos negativos. Sin embargo, dejando eso de lado, no creemos que se trate de una «compensación» inherente: creemos que podemos entrenar modelos con tasas bajas tanto de falsos positivos como de falsos negativos, ¡y por eso realizamos pruebas comparativas en ambos aspectos!

Esto es lo que hemos descubierto.

Modelo	Precisión	Muestras
GPT-5	99.81%	3668/3675
GPT-5-chat-última versión	99.97%	3673/3674
GPT-5-mini	99.92%	3651/3654
GPT-5-nano	99.97%	3667/3668
GPT-OSS-120b	100.00%	1709/1709
GPT-OSS-20b	99.74%	2287/2293

¿Pangram detecta GPT-5?

Según las pruebas iniciales que hemos realizado hoy, GPT-5 no supone ninguna amenaza para las capacidades de detección de Pangram, lo cual es muy importante, ya que pronto se convertirá en el modelo predeterminado de ChatGPT para todos los usuarios, incluso para aquellos que utilizan la versión gratuita. Aunque es posible que otros detectores de IA logren detectar GPT-5 con el tiempo, Pangram es el único que funciona de forma inmediata y fiable en la actualidad.

Prueba el detector de IA de Pangram para comprobar si un texto ha sido generado por GPT-5 u otros modelos de lenguaje a gran escala.

Bradley EmiDirector técnico y cofundador

Bradley es investigador en inteligencia artificial y experto en el desarrollo de productos de aprendizaje profundo para el sector industrial. Recientemente ha dirigido el grupo de investigación en aprendizaje profundo de Absci, una empresa dedicada al descubrimiento de fármacos mediante IA generativa, y anteriormente formó parte del equipo principal de visión artificial de Tesla Autopilot.

Durante sus estudios de posgrado, Bradley fue autor de varias publicaciones sobre investigación en aprendizaje profundo en el Stanford Vision Lab. Es licenciado en Física y tiene un máster en Inteligencia Artificial por la Universidad de Stanford. Además de la IA, le apasionan la educación y la filosofía, y es un ávido golfista.

Más de Bradley Emi

Lecturas relacionadas

Presentamos Pangram 3.2

Actualizaciones de productos

Presentamos Pangram 3.2

¡Te presentamos el último modelo Pangram con una capacidad de recuperación mejorada!

Katherine Thai27 de febrero de 2026

Informe técnico sobre la detección de textos generados por IA con alta precisión

Actualizaciones de productos

Informe técnico sobre la detección de textos generados por IA con alta precisión

En Pangram Labs, estamos desarrollando el mejor modelo de detección de texto basado en IA para proteger Internet de la avalancha de contenidos falsos, engañosos y de baja calidad.

Bradley Emi y Max Spero21 de febrero de 2024

Pangram es el único detector de IA que supera a los expertos humanos a la hora de identificar contenidos generados por IA

Actualizaciones de productos

Pangram es el único detector de IA que supera a los expertos humanos a la hora de identificar contenidos generados por IA

Nos alegra conocer los nuevos resultados de la investigación de Jenna Russell, Marzena Karpinska y Mohit Iyyer, investigadores de la Universidad de Maryland y Microsoft, que demuestran que Pangram es el mejor sistema de detección de IA.

Bradley Emi29 de enero de 2025

El compromiso de Pangram con la protección de datos

Actualizaciones de productos

El compromiso de Pangram con la protección de datos

Pangram ha actualizado recientemente su política de privacidad y sus condiciones de servicio. ¿Qué supone esto para los usuarios de Pangram?

Bradley Emi14 de agosto de 2025

¿Qué eficacia tiene Pangram a la hora de detectar modelos de razonamiento?

Actualizaciones de productos

¿Qué eficacia tiene Pangram a la hora de detectar modelos de razonamiento?

Descubre cómo funciona la detección de IA de Pangram en modelos de razonamiento como la serie o3 de OpenAI, Claude 4 y Gemini 2. 5.

Bradley Emi16 de julio de 2025

Un estudio independiente demuestra que Pangram es el detector de IA más eficaz

Actualizaciones de productos

Un estudio independiente demuestra que Pangram es el detector de IA más eficaz

Investigadores de la Universidad de Houston, la Universidad de California en Berkeley, la Universidad de California en Irvine y la empresa emergente Esperanto AI han descubierto que Pangram es el detector de texto generado por IA más fiable de entre una amplia variedad de métodos, tanto comerciales como de código abierto.

Bradley Emi30 de octubre de 2024

Suscríbete a nuestras novedades en

Manténgase informado con nuestras últimas noticias y ofertas.

soc2

SOC2 TIPO 2

Verificado por AssuranceLab

© 2025 Pangram. Todos los derechos reservados.

info@pangram.com

Únete a nuestra comunidad

© 2025 Pangram. Todos los derechos reservados.