Annunciamo una nuova partnership con Proofig! Per saperne di più

Come si confronta Pangram con GPTZero?

Bradley Emi
22 gennaio 2026

Il mercato della rilevazione dell'IA è oggi costituito da diversi grandi operatori. Forse ne avete già sentito parlare: Pangram, GPTZero, Turnitin, ZeroGPT e altri ancora.

Molte di queste aziende aggiornano regolarmente i propri modelli e pubblicano i dati relativi alle loro prestazioni. Recentemente, GPTZero ha lanciato un aggiornamento estivo dei modelli e ha pubblicato nuovi dati relativi alle loro prestazioni su una serie di nuovi modelli. In questo post del blog, confronteremo le prestazioni del nuovo modello di GPTZero con il rilevamento dell'IA di Pangram, inclusi gli ultimi modelli GPT-5.

Pangram contro GPTZero: numeri pubblicati

ModelloTasso di rilevamento dei pangrammiTasso di rilevamento GPTZeroRilevatore migliore
GPT-599.81%95.0%Pangram
GPT-5-chat-ultima versione99.97%Non testatoN/A
GPT-5-mini99.92%92.2%Pangram
GPT-5-nano99.97%96.1%Pangram
GPT-OSS-120b100.00%Non testatoN/A
GPT-OSS-20b99.74%Non testatoN/A
GPT4.199.48%96.8%Pangram
GPT4.1-mini99.94%98.7%Pangram
o399.86%89.9%Pangram
o3-mini100.00%98.4%Pangram
Gemini 2.5 Pro99.91%95.7%Pangram
Gemini 2.5 Flash99.75%98.2%Pangram
Claude Sonetto 499.91%99.1%Pangram

Nota: GPTZero non rende pubblici i propri set di dati di valutazione interna, quindi questi numeri non provengono dagli stessi identici documenti. Inoltre, GPTZero non rende noto il numero di documenti su cui effettua i test, quindi non è possibile confrontare nemmeno la quantità. Tuttavia, per quanto riguarda i numeri relativi alle prestazioni di Pangram, abbiamo valutato migliaia di documenti per ciascun modello, nonché un'ampia varietà di domini e schemi di prompt per simulare l'uso nel mondo reale.

Inoltre, l'accuratezza di Pangram non si limita a segnalare la maggior parte dei documenti generati dall'IA. Pangram è anche leader di mercato nel mantenere bassi i tassi di falsi positivi. Per noi è una priorità fondamentale non segnalare come generati dall'IA i documenti scritti da esseri umani. Di seguito è riportata la differenza tra i tassi di falsi positivi segnalati da Pangram e GPTZero:

PangramGPTZero
Tasso di falsi positivi (%)0.01%1%
Tasso di falsi positivi (#)~1 su 10.000 documenti~1 documento su 100

Post sul blog relativo al tasso di falsi positivi di GPTZero

Qui vediamo che le prestazioni di GPTZero riportano un tasso di falsi positivi (FPR) dell'1%.

Cosa emerge dalla ricerca? Pangram contro GPTZero

Pangram e GPTZero si sono anche confrontati in articoli di ricerca sull'IA sottoposti a revisione paritaria. Ciò è ben rappresentato dal recente studio dell'Università del Maryland intitolato "Le persone che utilizzano frequentemente ChatGPT per attività di scrittura sono in grado di individuare con precisione e sicurezza i testi generati dall'IA". Questo studio ha esaminato la capacità di annotatori esperti umani di classificare la differenza tra testi generati dall'uomo e testi generati dall'IA.

Nell'ambito dello studio, gli annotatori umani sono stati confrontati con rilevatori disponibili in commercio e open source. Pangram ha ottenuto risultati migliori rispetto a ciascun rilevatore umano individuale, nonché rispetto a tutte le alternative commerciali, compreso GPTZero.

GPT-4oClaude
Pangram100%100%
GPTZero100%97.6%
Annotatore 196.7%100%
Annotatore 296.7%100%
Annotatore 386.7%80%
Annotatore 490.0%96.7%
Annotatore 593.3%93.3%

Prestazioni multilingue

Le differenze tra il modello di punta di Pangram e GPTZero non finiscono qui. Entrambi i modelli sono "multilingue", il che significa che sono in grado di rilevare l'IA in più lingue oltre all'inglese. Pangram è multilingue in tutte le 20 lingue più diffuse su Internet. GPTZero supporta l'inglese, il francese e lo spagnolo. Ecco le lingue in cui è stato testato ciascun modello:

LinguaTasso di falsi positivi Pangram (FPR)Tasso di falsi positivi (FPR) di GPTZeroTasso di rilevamento Pangram AITasso di rilevamento dell'IA GPTZero
Spagnolo0.00%5.6%100.0%96.4%
Francese0.00%3.1%100.0%93.1%
Arabo0.10%Non testato100.0%Non testato
Ceco0.00%Non testato99.89%Non testato
Tedesco0.00%Non testato99.68%Non testato
greco0.00%Non testato99.79%Non testato
persiano0.00%Non testato100.0%Non testato
Hindi0.00%Non testato99.58%Non testato
Ungherese0.10%Non testato99.05%Non testato
italiano0.00%Non testato100.0%Non testato
giapponese0.00%Non testato100.0%Non testato
Olandese0.10%Non testato100.0%Non testato
Polacco0.00%Non testato100.0%Non testato
Portoghese0.00%Non testato100.0%Non testato
rumeno0.10%Non testato100.0%Non testato
russo0.00%Non testato100.0%Non testato
Svedese0.00%Non testato99.89%Non testato
turco0.00%Non testato99.79%Non testato
ucraino0.00%Non testato99.89%Non testato
urdu0.00%Non testato98.84%Non testato
Vietnamita0.00%Non testato99.89%Non testato
cinese0.00%Non testato99.89%Non testato

Per ulteriori informazioni sulle prestazioni di Pangram con testi multilingue, consulta questo post sul blog.

Prestazioni ESL

Inoltre, entrambi i modelli sono stati addestrati prestando particolare attenzione alle prestazioni ESL, poiché è risaputo che i rilevatori di IA potrebbero essere influenzati da pregiudizi nei confronti di chi non è madrelingua inglese. Sia GPTZero che Pangram hanno pubblicato risultati specifici sui testi ESL. Di seguito è possibile vedere come si posizionano:

Tasso di falsi positiviDimensione del campione
Pangram0.032%25,021
GPTZero1.1%91

Per saperne di più sull'approccio di Pangram ai testi ESL, dai un'occhiata a questo post sul blog https://www.pangram.com/blog/how-accurate-is-pangram-ai-detection-on-esl

Modelli inediti e GPT-5

Un altro motivo di preoccupazione per chi opera nel mercato del rilevamento dell'IA è la performance su modelli non ancora rilasciati. Con il continuo espandersi della guerra dell'IA, grandi laboratori di IA e piccole start-up rilasciano regolarmente modelli importanti. È importante che una soluzione di rilevamento dell'IA continui a fornire risultati accurati su modelli che potrebbero non essere stati addestrati direttamente.

Il recente rilascio di GPT-5 ha fornito un'ottima opportunità per scoprirlo! A poche ore dal rilascio del nuovo modello, il team di Pangram ha testato le prestazioni di GPTZero e Pangram su una varietà di tipi di prompt. Ecco come hanno fatto:

PangramGPTZero
Documento 1100%2%
Documento 2100%0%
Documento 3100%0%
Documento 4100%0%
Documento 5100%9%
Documento 699%0%
Documento 7100%0%
Documento 8100%0%
Documento 9100%29%
Documento 10100%0%
Documento 11100%10%

Nota: GPTZero ha successivamente rilasciato un aggiornamento del modello che promette prestazioni migliori su GPT-5! Per maggiori dettagli sul nostro confronto originale, consulta questo post sul blog. Inoltre, invitiamo gli utenti a completare i propri test per confrontare le prestazioni in qualsiasi momento.

Conclusione

Alla fine, Pangram continua a essere la scelta più solida e affidabile per rilevare i contenuti generati dall'intelligenza artificiale. Che le tue esigenze riguardino l'istruzione, l'editoria, la moderazione dei contenuti o qualcosa di ancora più specifico, siamo qui per offrirti un rilevamento accurato ed equo dell'intelligenza artificiale. Scopri di più sul nostro blog o contattaci all'indirizzo info@pangram.com.

Iscriviti alla nostra newsletter
Condividiamo aggiornamenti mensili sulla nostra ricerca nel campo del rilevamento dell'intelligenza artificiale.