¡Anunciamos una nueva colaboración con Proofig! Más información
Como comentamos la semana pasada, la IA tiende a abusar de ciertas palabras y frases. Es posible que se te ocurran algunas de ellas: desde «un testimonio de» hasta «profundizar». Ver suficientes frases de este tipo puede ser un indicador claro de que el texto que estás leyendo ha sido generado por IA, pero hay demasiadas como para que una sola persona pueda llevarlas todas la cuenta.
Para resolver este problema, recientemente hemos introducido una herramienta llamada «frases de IA», en la que destacamos específicamente estas frases. Como parte del proceso de creación de esta herramienta, hemos recopilado un amplio conjunto de datos con las frases de IA más utilizadas. En este artículo, repasaremos algunas de las frases de IA más comunes que aparecen en nuestro conjunto de datos y hablaremos de cómo puedes utilizarlas para agudizar tu propia intuición en torno al texto generado por IA.
Deberíamos empezar por lo más obvio: ¡a veces una IA te dice que es una IA! A menudo, esto ocurre como resultado de una negativa. Cuando un usuario le ha pedido a una IA algo que se le ha prohibido hacer, esta tiene que decirle al usuario que no puede cumplir con la solicitud y, como parte de ello, el modelo suele reconocer que es una IA. Muchas negativas de la IA comienzan con la frase «Como modelo de lenguaje de IA...». De ahí se deduce que este tipo de frases serían bastante comunes en los textos de IA y extremadamente raras en los textos humanos. ¡Las cifras lo confirman! Muchas de nuestras frases de IA más comunes son autorreferenciales.
| Frase | Veces más común |
|---|---|
| Como modelo de lenguaje de IA, | 294,000x |
| No tengo personal. | 67,000x |
| Por desgracia, no tengo suficiente. | 54,000x |
| modelo de lenguaje, no puedo | 53,000x |
Los artefactos de IA son algunas de nuestras frases de IA «más utilizadas», pero en última instancia son bastante obvias y, por lo tanto, bastante poco interesantes. Ahora llegamos a la parte interesante: frases que están realmente sobrerrepresentadas en los textos de IA, pero que no tienen nada que ver con «ser una IA». Aquí hay un par de ejemplos:
| Frase | Veces más común |
|---|---|
| como conmovedor | 49,000x |
| Como un poderoso recordatorio | 43,000x |
| recordatorio de lo perdurable | 31,000x |
| enfrentó numerosos desafíos | 30,000x |
| Nuestros resultados proporcionan nuevos conocimientos sobre | 22,000x |
| en la compleja interacción | 21,000x |
| sirve como un poderoso | 10,000x |
| proporcionando información valiosa sobre | 5,000x |
| sirve como testimonio | 4,000x |
| nuevo sentido de propósito | 4,000x |
| incluso ante lo inimaginable | 3,000x |
| recordatorio del potencial | 3,000x |
Es fácil entender por qué una IA que dice «Como IA...» puede ser mucho más común en los textos de IA. Pero, ¿qué hace que las frases aparentemente inconexas de la parte 2 sean más comunes? En primer lugar, existe un fenómeno conocido como «colapso modal», en el que los resultados de la IA se vuelven excesivamente genéricos o repetitivos al basarse en secuencias de palabras de alta probabilidad. Colapso modal...
Además, después del entrenamiento, es habitual realizar RLHF: aprendizaje por refuerzo a partir de comentarios humanos. Durante este proceso, los anotadores humanos califican el texto generado por la IA en función de una serie de atributos para intentar fomentar algunos patrones y desalentar otros. A lo largo de este proceso, si ciertas respuestas o frases tienen más probabilidades de ser recompensadas por estos anotadores humanos, se volverán cada vez más frecuentes.
Como resultado, algunas de estas frases sobreutilizadas pueden considerarse una característica de modelos, arquitecturas y procesos de entrenamiento específicos, en lugar de simples rasgos distintivos de la escritura de IA en sí misma. Un artículo de Jenna Russell, Marzena Karpinska y Mohit Iyyer, de la Universidad de Maryland, muestra que los diferentes modelos tienen en realidad diferentes frases preferidas:
sobreutilizado
Esto sugiere que diferentes modelos, entrenados con diferentes conjuntos de datos y estrategias de optimización, pueden desarrollar sus propias tendencias distintivas en la repetición de frases.
Como parte de nuestro trabajo, nuestro equipo ha dedicado innumerables horas a leer y analizar textos generados por IA. Naturalmente, hemos desarrollado afinidad por algunas de estas frases:
Estas son las frases favoritas de nuestro equipo sobre la IA:
Max (director ejecutivo): «En constante evolución» (11 000 veces).
Bradley (director técnico): «importante tener en cuenta» (3000 veces)
Lu (ingeniero fundador): «naturaleza intrincada» (6000x)
Elyas (ingeniero fundador): «tapiz vibrante» (17 000x)
