Nuevo

Descubre al instante qué publicaciones son de personas y cuáles de IA en Twitter, LinkedIn, Substack y otras plataformas. Descarga nuestra nueva extensión para Chrome.

Más información
Actualizaciones de productos

Actualización del texto pangram: GPT-4o, Claude 3, LLaMA 3

22 de mayo de 2024

Foto de Google DeepMind.Foto de Google DeepMind.

Hoy nos complace mostrar nuestra capacidad para adaptarnos rápidamente a los nuevos LLM del mercado con el lanzamiento de una actualización de nuestro modelo que alcanza una precisión casi perfecta en la detección de texto escrito por IA de GPT-4o, Claude 3 y LLaMA 3.

TL;DR:

  • Hemos lanzado una nueva versión de Pangram Text que mejora el rendimiento en GPT-4o, Claude 3 y LLaMA 3.
  • Nuestra infraestructura está preparada para incorporar rápidamente grandes cantidades de texto generado por IA a partir de nuevos modelos tan pronto como estén disponibles públicamente.
  • Hemos observado que, a medida que el rendimiento de todos estos nuevos modelos converge hacia el nivel de rendimiento de GPT-4, todos ellos comienzan a sonar igual también desde el punto de vista estilístico.

Resultados

Nuestro modelo más reciente era bastante bueno detectando los resultados de los nuevos modelos, incluso sin haber visto ningún ejemplo de ellos en el conjunto de entrenamiento. Sin embargo, no nos conformamos con ser «bastante buenos», queremos asegurarnos de que seguimos ampliando las fronteras de lo que es posible con la detección mediante IA y de que conseguimos la mayor precisión posible para nuestros clientes.

Para comprobar nuestro rendimiento en los modelos lingüísticos de última generación, hemos renovado nuestro conjunto de evaluación, compuesto por 25 000 ejemplos de textos humanos difíciles de clasificar y textos generados por IA a partir de un panel de modelos lingüísticos. Aproximadamente el 40 % de este nuevo conjunto de evaluación consiste en una amplia variedad de textos generados por IA a partir de GPT-4o, Claude 3 y LLaMA 3, que abarcan varios ámbitos, como noticias, reseñas, educación y mucho más.

Utilizamos todas las versiones de los nuevos modelos cuando están disponibles: por ejemplo, tomamos muestras de manera uniforme de las versiones Opus, Sonnet y Haiku de Claude 3.

Tras actualizar nuestro conjunto de datos de entrenamiento para incorporar los últimos LLM, hemos comprobado que, una vez más, estamos logrando una precisión casi perfecta en el texto generado por la última generación de modelos lingüísticos.

LLMTexto pangramático Precisión de marzoTexto pangramático Precisión de mayo% de mejora
Todo99.54%99.84%+0.30%
GPT-4o99.78%100%+0.22%
Claude 399.12%99.76%+0.64%
LLaMA 399.58%99.97%+0.39%

Además de mejorar el rendimiento en los nuevos modelos, hemos descubierto que incluir datos de entrenamiento de la última generación de modelos mejora ligeramente el rendimiento en varios modelos antiguos.

Hemos observado que, aunque no introducimos regresiones en nuestro antiguo conjunto de evaluación de modelos, en realidad mejoramos varios casos de detección de GPT-3.5 y GPT-4 (normal). En concreto, hemos observado que 8 casos de GPT-3.5 que antes fallaban en el modelo ahora pasan, y 13 casos de GPT-4 que antes fallaban en el modelo ahora pasan. Concluimos aquí que la mayor capacidad de nuestro modelo para detectar GPT-4o, Claude 3 y LLaMA 3 no supone ningún coste en cuanto a la capacidad de detectar modelos más antiguos.

Mantenerse a la vanguardia

Desde el principio fuimos conscientes de que la frontera de los LLM cambiaría rápidamente, por lo que diseñamos la arquitectura de nuestro sistema teniendo esto en cuenta. Nuestros sistemas están construidos para poder regenerar datos y comenzar a entrenar un nuevo modelo en cuestión de horas desde que una nueva API se pone a disposición del público.

Cuando se lanza un nuevo modelo, generar un nuevo conjunto de datos y volver a entrenar el modelo es tan sencillo como cambiar la configuración. Contamos con una biblioteca estándar de plantillas de prompts diseñadas para introducirse en los LLM con el fin de producir textos similares a los humanos, que se acercan, pero no son exactamente iguales, a la parte humana de nuestro conjunto de datos. Detallamos este proceso, denominado «Hard Negative Mining with Synthetic Mirrors» (minería de negativos duros con espejos sintéticos), en nuestro informe técnico.

El calendario para el lanzamiento de este nuevo modelo fue el siguiente:

13 de mayo: Se lanzó GPT-4o y se puso a disposición en la API de OpenAI. 14 de mayo: Se actualizó el canal de datos y se crearon nuevos conjuntos de entrenamiento y evaluación. 15-16 de mayo: Se entrenó el modelo de detección de IA utilizando los nuevos conjuntos de datos. 17 de mayo: Se realizaron controles de calidad y comprobaciones de integridad y se lanzó el modelo.

La infraestructura que hemos construido nos permite adaptarnos rápidamente, incluyendo el texto de los nuevos modelos en el sistema de detección de producción en solo una semana.

¿Rendimientos decrecientes?

A medida que los nuevos modelos mejoran, deben ser más difíciles de detectar, ¿verdad? Todavía no hemos encontrado pruebas que respalden este argumento tentador, pero en última instancia erróneo.

Desde el punto de vista observacional, estamos descubriendo que los modelos más capaces, debido a sus estilos más idiosincrásicos, son en realidad más fáciles de detectar que los modelos menos capaces. Por ejemplo, descubrimos que nuestro antiguo modelo era mejor para detectar a Claude Opus que a Sonnet y Haiku.

Como vemos en la tabla de clasificación de LMSYS, muchos modelos básicos están convergiendo asintóticamente al nivel de GPT-4, pero ningún modelo lo ha superado aún de manera convincente por un margen sustancial. Si observamos la situación desde una perspectiva global, si varias empresas de modelos básicos adoptan la misma arquitectura basada en la atención y la entrenan en todo Internet, no es de extrañar que el lenguaje que salga de todos los modelos acabe sonando increíblemente similar entre sí. Quienes interactúan con modelos de lenguaje de forma habitual comprenderán inmediatamente lo que queremos decir con esto.

A nivel observacional, seguimos constatando que los LLM, cuando se les pide que escriban de forma creativa y auténtica, como un ensayo de opinión, una reseña o un relato corto creativo, siguen produciendo tonterías insulsas y poco imaginativas. Creemos que esto es fundamentalmente una propiedad del objetivo de optimización de predecir completaciones de alta probabilidad, al tiempo que se alejan de pensamientos e ideas originales fuera de la distribución.

Valoramos los escritos originales de nuestros semejantes porque pueden ofrecernos una perspectiva nueva o una forma diferente de pensar, no porque sean lo que una persona diría normalmente. Mientras este valor siga siendo válido, siempre habrá necesidad de detectar la IA y siempre habrá una forma de resolverlo.


Bradley Emi
Bradley EmiDirector técnico, cofundador

Bradley es investigador en inteligencia artificial y experto en el desarrollo de productos de aprendizaje profundo en la industria. Recientemente dirigió el grupo de investigación en aprendizaje profundo de Absci, una empresa de descubrimiento de fármacos basada en inteligencia artificial generativa, y anteriormente fue miembro del equipo central de visión artificial de Tesla Autopilot.

Mientras era estudiante de posgrado, Bradley fue autor de múltiples publicaciones sobre investigación en aprendizaje profundo con el Stanford Vision Lab. Tiene una licenciatura en Física y un máster en Inteligencia Artificial por la Universidad de Stanford. Además de la IA, también le apasiona la educación y la filosofía, y es un ávido golfista.

Más de Bradley Emi

Lecturas relacionadas

¿Pangram detecta Llama 4 de Meta?
Actualizaciones de productos

¿Pangram detecta Llama 4 de Meta?

6 de abril de 2025
¿Qué tan bien puede Pangram detectar modelos de razonamiento?
Actualizaciones de productos

¿Qué tan bien puede Pangram detectar modelos de razonamiento?

16 de julio de 2025
¡El detector de texto Pangram AI ahora es multilingüe!
Actualizaciones de productos

¡El detector de texto Pangram AI ahora es multilingüe!

1 de julio de 2024
El compromiso de Pangram con la privacidad de los datos
Actualizaciones de productos

El compromiso de Pangram con la privacidad de los datos

14 de agosto de 2025
¡Te presentamos Pangram 3.3!
Actualizaciones de productos

¡Te presentamos Pangram 3.3!

13 de mayo de 2026
¿Qué tal funciona Pangram en los humanizadores? (Actualizado en agosto de 2025)
Actualizaciones de productos

¿Qué tal funciona Pangram en los humanizadores? (Actualizado en agosto de 2025)

27 de agosto de 2025