Annunciamo una nuova partnership con Proofig! Per saperne di più

Una passeggiata tra le frasi più abusate dell'IA

Elyas Masrour
21 febbraio 2025

Come abbiamo discusso la settimana scorsa, l'IA tende a usare in modo eccessivo determinate parole e frasi. Probabilmente ne conosci già alcune: da "una testimonianza di" a "approfondire". La presenza di un numero sufficiente di queste frasi può essere un indicatore affidabile del fatto che il testo che stai leggendo è stato generato dall'IA, ma sono talmente tante che è impossibile tenerne traccia per una singola persona.

Per risolvere questo problema, abbiamo recentemente introdotto uno strumento chiamato "frasi AI", in cui evidenziamo specificatamente queste frasi. Nell'ambito del processo di creazione di questo strumento, abbiamo creato un ampio set di dati delle frasi AI più comunemente utilizzate. In questo articolo, vi illustreremo alcune delle frasi AI più comuni che compaiono nel nostro set di dati e vi spiegheremo come utilizzarle per affinare il vostro intuito riguardo ai testi generati dall'intelligenza artificiale.

Parte 1: Artefatti dell'IA

Dovremmo iniziare con l'ovvio: a volte un'IA ti dice effettivamente che è un'IA! Spesso questo accade a seguito di un rifiuto. Quando un utente chiede a un'IA qualcosa che le è stato vietato di fare, essa deve comunicare all'utente che non può soddisfare la richiesta e, in tal caso, il modello spesso riconosce di essere un'IA. Molti rifiuti dell'IA iniziano con la frase "In quanto modello linguistico di IA...". Ne consegue che questo tipo di frase sarebbe abbastanza comune nei testi generati dall'IA ed estremamente raro nei testi scritti da esseri umani. I numeri lo confermano! Molte delle nostre frasi più comuni generate dall'IA sono autoreferenziali.

FrasePiù frequente
Come modello linguistico basato sull'intelligenza artificiale,294,000x
Non ho personali67,000x
Purtroppo non ne ho abbastanza.54,000x
modello linguistico, non posso53,000x

Parte 2: Frasi abusate

Gli artefatti dell'IA sono alcune delle nostre espressioni "più abusate" nell'ambito dell'intelligenza artificiale, ma in definitiva sono piuttosto ovvi e quindi poco interessanti. Ora arriviamo alla parte interessante: espressioni che sono effettivamente sovrarappresentate nei testi sull'IA, ma che non hanno nulla a che vedere con "l'essere un'IA". Eccone un paio:

FrasePiù frequente
come struggente49,000x
Come potente promemoria43,000x
ricordo dell'eterno31,000x
ha affrontato numerose sfide30,000x
I nostri risultati forniscono nuove informazioni su22,000x
nella complessa interazione21,000x
funge da potente10,000x
fornendo preziose informazioni su5,000x
funge da testimonianza4,000x
nuovo senso di determinazione4,000x
anche di fronte all'inimmaginabile3,000x
promemoria del potenziale3,000x

Parte 3: Perché l'IA usa troppo le frasi?

È facile capire perché un'intelligenza artificiale che dice "Come intelligenza artificiale..." possa essere molto più comune nei testi generati dall'intelligenza artificiale. Ma cosa fa sì che le frasi apparentemente non correlate nella Parte 2 siano più comuni? Innanzitutto, esiste un fenomeno noto come "collasso modale", in cui i risultati dell'intelligenza artificiale diventano eccessivamente generici o ripetitivi basandosi su sequenze di parole ad alta probabilità. Collasso modale...

Inoltre, dopo l'addestramento, è prassi standard eseguire il RLHF: Reinforcement Learning from Human Feedback (apprendimento rinforzato dal feedback umano). Durante questo processo, gli annotatori umani valutano il testo generato dall'IA sulla base di una serie di attributi per cercare di incoraggiare alcuni modelli e scoraggiarne altri. Nel corso di questo processo, se determinate risposte o frasi sono suscettibili di essere premiate da questi annotatori umani, diventeranno sempre più frequenti.

Di conseguenza, alcune di queste frasi abusate possono essere considerate una caratteristica di specifici modelli, architetture e processi di addestramento, piuttosto che semplici tratti distintivi della scrittura AI stessa. Un articolo di Jenna Russell, Marzena Karpinska e Mohit Iyyer dell'Università del Maryland dimostra che modelli diversi hanno in realtà frasi preferite diverse:

abusato

Ciò suggerisce che modelli diversi, addestrati con set di dati e strategie di ottimizzazione differenti, possono sviluppare tendenze distinte nella ripetizione delle frasi.

Bonus: gli N-gram preferiti dal nostro team

Nell'ambito del nostro lavoro, il nostro team ha dedicato innumerevoli ore alla lettura e all'analisi di testi generati dall'intelligenza artificiale. Naturalmente, abbiamo sviluppato una certa affinità con alcune di queste frasi:

Ecco le frasi AI preferite dal nostro team:

  • Max (CEO): "In continua evoluzione" (11.000x)

  • Bradley (CTO): "importante da notare" (3.000x)

  • Lu: (Ingegnere fondatore): "natura intricata" (6.000x)

  • Elyas (ingegnere fondatore): "arazzo vivace" (17.000x)

Iscriviti alla nostra newsletter
Condividiamo aggiornamenti mensili sulla nostra ricerca nel campo del rilevamento dell'intelligenza artificiale.