¡Anunciamos una nueva colaboración con Proofig! Más información

Un repaso a las frases más manidas de la IA

Elyas Masrour
21 de febrero de 2025

Como comentamos la semana pasada, la IA tiende a abusar de ciertas palabras y frases. Es posible que se te ocurran algunas de ellas: desde «un testimonio de» hasta «profundizar». Ver suficientes frases de este tipo puede ser un indicador claro de que el texto que estás leyendo ha sido generado por IA, pero hay demasiadas como para que una sola persona pueda llevarlas todas la cuenta.

Para resolver este problema, recientemente hemos introducido una herramienta llamada «frases de IA», en la que destacamos específicamente estas frases. Como parte del proceso de creación de esta herramienta, hemos recopilado un amplio conjunto de datos con las frases de IA más utilizadas. En este artículo, repasaremos algunas de las frases de IA más comunes que aparecen en nuestro conjunto de datos y hablaremos de cómo puedes utilizarlas para agudizar tu propia intuición en torno al texto generado por IA.

Parte 1: Artefactos de IA

Deberíamos empezar por lo más obvio: ¡a veces una IA te dice que es una IA! A menudo, esto ocurre como resultado de una negativa. Cuando un usuario le ha pedido a una IA algo que se le ha prohibido hacer, esta tiene que decirle al usuario que no puede cumplir con la solicitud y, como parte de ello, el modelo suele reconocer que es una IA. Muchas negativas de la IA comienzan con la frase «Como modelo de lenguaje de IA...». De ahí se deduce que este tipo de frases serían bastante comunes en los textos de IA y extremadamente raras en los textos humanos. ¡Las cifras lo confirman! Muchas de nuestras frases de IA más comunes son autorreferenciales.

FraseVeces más común
Como modelo de lenguaje de IA,294,000x
No tengo personal.67,000x
Por desgracia, no tengo suficiente.54,000x
modelo de lenguaje, no puedo53,000x

Parte 2: Frases sobreutilizadas

Los artefactos de IA son algunas de nuestras frases de IA «más utilizadas», pero en última instancia son bastante obvias y, por lo tanto, bastante poco interesantes. Ahora llegamos a la parte interesante: frases que están realmente sobrerrepresentadas en los textos de IA, pero que no tienen nada que ver con «ser una IA». Aquí hay un par de ejemplos:

FraseVeces más común
como conmovedor49,000x
Como un poderoso recordatorio43,000x
recordatorio de lo perdurable31,000x
enfrentó numerosos desafíos30,000x
Nuestros resultados proporcionan nuevos conocimientos sobre22,000x
en la compleja interacción21,000x
sirve como un poderoso10,000x
proporcionando información valiosa sobre5,000x
sirve como testimonio4,000x
nuevo sentido de propósito4,000x
incluso ante lo inimaginable3,000x
recordatorio del potencial3,000x

Parte 3: ¿Por qué la IA abusa de las frases?

Es fácil entender por qué una IA que dice «Como IA...» puede ser mucho más común en los textos de IA. Pero, ¿qué hace que las frases aparentemente inconexas de la parte 2 sean más comunes? En primer lugar, existe un fenómeno conocido como «colapso modal», en el que los resultados de la IA se vuelven excesivamente genéricos o repetitivos al basarse en secuencias de palabras de alta probabilidad. Colapso modal...

Además, después del entrenamiento, es habitual realizar RLHF: aprendizaje por refuerzo a partir de comentarios humanos. Durante este proceso, los anotadores humanos califican el texto generado por la IA en función de una serie de atributos para intentar fomentar algunos patrones y desalentar otros. A lo largo de este proceso, si ciertas respuestas o frases tienen más probabilidades de ser recompensadas por estos anotadores humanos, se volverán cada vez más frecuentes.

Como resultado, algunas de estas frases sobreutilizadas pueden considerarse una característica de modelos, arquitecturas y procesos de entrenamiento específicos, en lugar de simples rasgos distintivos de la escritura de IA en sí misma. Un artículo de Jenna Russell, Marzena Karpinska y Mohit Iyyer, de la Universidad de Maryland, muestra que los diferentes modelos tienen en realidad diferentes frases preferidas:

sobreutilizado

Esto sugiere que diferentes modelos, entrenados con diferentes conjuntos de datos y estrategias de optimización, pueden desarrollar sus propias tendencias distintivas en la repetición de frases.

Bonificación: los N-gramas favoritos de nuestro equipo

Como parte de nuestro trabajo, nuestro equipo ha dedicado innumerables horas a leer y analizar textos generados por IA. Naturalmente, hemos desarrollado afinidad por algunas de estas frases:

Estas son las frases favoritas de nuestro equipo sobre la IA:

  • Max (director ejecutivo): «En constante evolución» (11 000 veces).

  • Bradley (director técnico): «importante tener en cuenta» (3000 veces)

  • Lu (ingeniero fundador): «naturaleza intrincada» (6000x)

  • Elyas (ingeniero fundador): «tapiz vibrante» (17 000x)

Suscríbase a nuestro boletín informativo
Compartimos actualizaciones mensuales sobre nuestra investigación en detección de IA.