Annunciamo una nuova partnership con Proofig! Per saperne di più

Sì, il rilevamento dell'IA può essere accurato.

Alex Roitman
16 settembre 2025

TLDR; Gli accademici e i moderatori di contenuti dovrebbero rivalutare le loro valutazioni degli strumenti di rilevamento dell'IA o dei controllori dell'IA. Il consenso precedente raggiunto nel 2023 sulla base di articoli accademici e media popolari è ormai superato. Gli ultimi modelli di rilevamento dell'IA, come Pangram, non solo hanno raggiunto gli ultimi LLM, ma sono stati progettati per essere a prova di futuro.

Come siamo arrivati a questo punto: una breve storia del rilevamento dell'IA


Quando ChatGPT è stato lanciato nel 2022, scrittori e creatori di contenuti hanno iniziato a utilizzare in massa questo nuovo strumento di intelligenza artificiale per creare contenuti. Da allora non si è più fermato. I creatori hanno sfruttato ChatGPT (e altri modelli di IA) e i suoi concorrenti per scrivere di tutto, da documenti di grandi dimensioni come articoli di ricerca e romanzi a piccoli frammenti come e-mail, commenti su Reddit e recensioni su Amazon. I contenuti generati dall'IA hanno invaso Internet. Tuttavia, sin dall'introduzione degli LLM, è emersa l'esigenza di separare ciò che è scritto dall'uomo da ciò che è scritto dall'IA. OpenAI ha effettivamente intuito questa necessità e ha creato un prodotto in grado di classificare il testo come IA. Con l'aumento dell'adozione dell'IA, è cresciuta la domanda di rilevatori o classificatori di IA, in particolare nelle scuole e nelle università, dove l'integrità accademica è fondamentale. Alcuni studenti (che spesso sono i primi ad adottare le nuove tecnologie) hanno utilizzato i modelli più recenti per completare i compiti, sostenere gli esami e presentare domanda di ammissione all'università. Alcuni ricercatori, sotto la pressione del tempo, hanno preso delle scorciatoie e hanno presentato lavori scritti o assistiti dall'intelligenza artificiale per le pubblicazioni. Pertanto, sono stati lanciati molti strumenti nella speranza di affrontare queste preoccupazioni. I software accademici già affermati come TurnItIn hanno lanciato nell'aprile 2023 uno strumento chiamato AI Checker per soddisfare le esigenze dei clienti nel settore dell'istruzione. Anche Grammarly ha lanciato nel 2024 il proprio strumento chiamato Grammarly Authorship. L'idea prevalente di queste aziende era che se i loro strumenti erano in grado di identificare il plagio, avrebbero dovuto identificare anche l'IA. L'istruzione superiore, in particolare, aveva bisogno di passare dai "controllori di plagio" ai "controllori di IA". Tuttavia, era chiaro fin dall'inizio che questo non avrebbe funzionato.

I primi rilevatori di IA promettevano accuratezza utilizzando i concetti di perplessità e irregolarità. Il CTO di Pangram, Bradley Emi, spiega questi termini: "La perplessità è quanto ogni parola in un testo sia inaspettata o sorprendente. L'irregolarità è il cambiamento nella perplessità nel corso di un documento. Se alcune parole e frasi sorprendenti sono sparse in tutto il documento, allora esso ha un'elevata irregolarità".

Non ci soffermeremo su questi termini, ma affidarsi eccessivamente a questi fattori durante la creazione di uno strumento di rilevamento dell'IA comporta tre difetti ricorrenti:

Si tratta di preoccupazioni reali, in particolare per le istituzioni accademiche. L'accusa infondata rivolta a studenti e ricercatori di utilizzare l'IA nei loro studi e nelle loro pubblicazioni ha un peso enorme. Può rovinare una carriera. È incredibilmente rischioso affidarsi a strumenti con un'efficacia anche solo del 95% nel filtrare l'IA. Pertanto, molte istituzioni accademiche di alto livello come il MIT, la Vanderbilt e la UC Berkeley non supportano l'uso di rilevatori di IA da parte dei loro insegnanti. In molti casi, hanno citato articoli di ricerca specifici che descrivono le scarse prestazioni dei rilevatori di IA, come Testing of Detection Tools for AI-Generated Text, e articoli di settore come Why AI writing detectors don't work.

OpenAI ha ritenuto questi problemi così difficili da rinunciare al proprio classificatore di testo basato sull'intelligenza artificiale nel luglio 2023, affermando che "il classificatore AI non è più disponibile a causa del suo basso tasso di accuratezza". Molti amministratori scolastici sono giunti alla conclusione che se OpenAI non è in grado di farlo, probabilmente è impossibile.

Mentre le migliori università e l'opinione pubblica giungevano al consenso che la promessa del rilevamento dell'IA fosse impossibile o addirittura una bufala, aziende come Pangram Labs hanno apportato miglioramenti significativi in questo campo, rendendo il rilevamento dell'IA uno strumento fondamentale in ambito universitario e aziendale.

Perché il rilevamento dell'IA sarà diverso nel 2025

Il rilevamento dell'intelligenza artificiale viene spesso definito come una corsa agli armamenti tra studenti alla ricerca di scorciatoie e insegnanti che cercano di distinguere ciò che è scritto da esseri umani da ciò che non lo è. Nel 2025, i rilevatori hanno alzato la posta in gioco.

Nell'agosto 2025, due ricercatori della Chicago Booth, Brian Jabarian e Alex Emi, hanno pubblicato un articolo intitolato Scrittura artificiale e rilevamento automatico, in cui affermavano che "la maggior parte dei rilevatori di IA commerciali funzionano molto bene, con Pangram che in particolare raggiunge tassi di falsi positivi e falsi negativi vicini allo zero". Essi definiscono Pangram "l'unico rilevatore che soddisfa un rigoroso limite massimo (tassi di falsi positivi ≤ 0,005) senza compromettere la capacità di rilevare con precisione il testo generato dall'IA". Questo è un esempio di quanto sia progredita la rilevazione dell'IA in pochi anni. Ma come è potuto accadere?

In primo luogo, i ricercatori nel campo dell'IA hanno migliorato i set di dati raccogliendo una gamma più ampia di testi scritti da esseri umani e generati dall'IA. Ciò include non solo articoli accademici, ma anche altri scritti come e-mail e articoli. In secondo luogo, gli sviluppatori hanno utilizzato l'apprendimento attivo per ridurre i tassi di falsi positivi. Ciò significa che cercano i testi più difficili da classificare come scritti dall'IA o da esseri umani, per poi reintegrarli nei loro modelli.

E nella corsa agli armamenti, i creatori di Gen AI non hanno reagito abbastanza per superare alcuni rilevatori di IA. Quando è stato rilasciato il tanto pubblicizzato GPT-5 di OpenAI, prometteva allucinazioni ridotte, tono migliorato e scrittura più creativa. Entro 12 ore, il cofondatore di Pangram Labs, Max Spero, ha pubblicato su LinkedIn che, senza alcuna formazione aggiuntiva, lo strumento di rilevamento dell'IA di Pangram era in grado di classificare i test GPT-5 a una velocità simile a quella dei modelli precedenti:

"Pangram è l'unico rilevatore di IA in grado di rilevare in modo affidabile GPT-5 senza essere stato espressamente addestrato a farlo."

Le istituzioni stanno adeguandosi alla nuova realtà

Esistono preoccupazioni fondate sull'uso dei rilevatori di IA. Molti di essi presentano ancora tassi di falsi positivi allarmanti e pubblicizzano in modo ingannevole la loro accuratezza. Tuttavia, alcune delle tecnologie più recenti sono incredibilmente affidabili e vengono attivamente integrate nelle aziende e nelle università. Ad esempio, la società di sourcing di esperti Qwoted ha recentemente integrato il rilevamento AI nel proprio flusso di lavoro per ridurre le citazioni scritte dall'intelligenza artificiale da parte di "esperti". "Il futuro del giornalismo dipende dalla fiducia. Ecco perché siamo lieti di collaborare con Pangram, che ha stabilito lo standard di riferimento per il rilevamento e l'attribuzione dell'intelligenza artificiale".

Anche ricercatori e giornalisti stanno tornando sui loro passi. I critici di lunga data stanno cambiando le loro opinioni e stanno studiando modi per integrare il rilevamento dell'IA in una politica più ampia in materia di IA. Rob Waugh di Press Gazette ha recentemente raccomandato Pangram agli utenti che desiderano individuare i testi generati dall'IA. "Questi strumenti non sono affidabili al 100%, ma Pangram è stato valutato come accurato rispetto ad altri strumenti di controllo dell'IA online ed è integrato in servizi di risposta giornalistica come Qwoted per rilevare proposte e testi generati dall'IA".

Siamo interessati a discutere il tuo caso d'uso e a valutare se Pangram possa essere utile alla tua organizzazione. Prova i nostri servizi e contattaci per conoscere le nostre offerte aziendali.

Iscriviti alla nostra newsletter
Condividiamo aggiornamenti mensili sulla nostra ricerca nel campo del rilevamento dell'intelligenza artificiale.