Scopri subito cosa è pubblicato da persone e cosa dall'IA su Twitter, LinkedIn, Substack e altre piattaforme. Scarica la nostra nuova estensione per Chrome.
Oggi OpenAI ha rilasciato GPT-4.5: l'ultimo e più avanzato modello linguistico disponibile, nonché un importante aggiornamento di ChatGPT. Pur non raggiungendo statistiche di riferimento paragonabili a modelli di ragionamento come DeepSeek R1 e OpenAI O3, GPT-4.5 rappresenta il modello più grande e atteso dell'anno fino ad ora, e siamo entusiasti di provarlo. OpenAI sostiene che ci siano grandi miglioramenti nella qualità della scrittura e sui social media si trovano già commenti entusiastici sulle sue prestazioni.
Volevamo rispondere alla domanda che molti si pongono: con il miglioramento dei modelli, è ancora possibile rilevare i testi generati dall'IA con GPT-4.5? Oggi abbiamo eseguito un rapido test per scoprirlo.
Abbiamo iniziato campionando 11 prompt indicativi delle attività di scrittura quotidiane che si potrebbero richiedere a ChatGPT.
Ecco i suggerimenti che abbiamo utilizzato:
Abbiamo cercato di rendere i prompt il più possibile diversificati e vari, e inoltre abbiamo cercato di scrivere prompt che mostrassero una differenza qualitativa significativa rispetto ai precedenti modelli GPT: in altre parole, se c'era la possibilità per il modello di essere creativo e mostrare il fattore "wow", abbiamo fatto del nostro meglio per offrire a GPT-4.5 questa opportunità.
| Sollecito | Pangram | Principale concorrente 1 | Principale concorrente 2 |
|---|---|---|---|
| Conservazione dei koala | 100% | 100% | 100% |
| E-mail del giornale | 100% | 100% | 67% |
| Semiconduttore a temperatura ambiente | 100% | 56% | 86% |
| Divise scolastiche | 85% | 100% | 80% |
| Diario di poesia | 100% | 100% | 15% |
| Recensione Escape Room | 100% | 81% | 56% |
| Film russo Email | 100% | 100% | 91% |
| Scena dell'atterraggio su Marte | 100% | 43% | 7% |
| Komodo Dragon Script | 98% | 88% | 0% |
| Poema di rottura di Halloween | 100% | 100% | 0% |
| Scena dell'inseguimento a Venezia | 100% | 49% | 9% |
Pangram è in grado di individuare tutti gli 11 saggi scritti da GPT-4.5, anche senza alcun dato relativo a GPT-4.5 nel set di addestramento. In confronto, i due principali concorrenti nel campo del rilevamento dell'IA presentano risultati al massimo discontinui. Mentre Pangram è in grado di prevedere con sicurezza che 10 campioni su 11 hanno una probabilità di provenienza dall'IA pari o superiore al 98%, la concorrenza spesso esprime un alto grado di incertezza o, nel peggiore dei casi, prevede con elevata sicurezza che il testo sia stato generato da un essere umano.
Pangram è di per sé un grande modello di apprendimento automatico che ha visto milioni di esempi di testi generati sia dall'uomo che dall'intelligenza artificiale. I modelli di grandi dimensioni tendono a generalizzare meglio e a cogliere modelli sottili nei testi generati dall'intelligenza artificiale che altri non sono in grado di cogliere. Il nostro approccio di apprendimento attivo riduce ulteriormente il tasso di falsi positivi aumentando al contempo la nostra sensibilità, consentendo al modello di funzionare bene su larga scala e di generalizzare a nuovi LLM in modo molto più efficace rispetto ai nostri concorrenti. Inoltre, la nostra attenzione alla qualità e alla diversità dei dati si traduce in un modello che ha molta più esperienza nella comprensione dei dettagli più sottili che altri modelli non sono in grado di cogliere.
Sì, il nostro strumento di rilevamento basato sull'intelligenza artificiale è ancora altamente efficace nel rilevare il testo generato da GPT-4.5.
Quindi, se vi state chiedendo come si comporterà Pangram quando uscirà un nuovo modello più grande e migliore, Pangram supera il test con la versione di IA più attesa che abbiamo visto da tempo, senza alcuna riqualificazione. Se non volete che il vostro software di rilevamento dell'IA smetta improvvisamente di funzionare la prossima volta che OpenAI aggiornerà il proprio modello, provate Pangram oggi stesso.
Per ulteriori informazioni sulla nostra ricerca o per ottenere crediti gratuiti per provare il nostro modello su GPT-4.5, contattaci all'indirizzo info@pangram.com.

Elyas Masrour è uno degli ingegneri fondatori di Pangram. Da quando è entrato a far parte di Pangram come secondo dipendente, appena uscito dall'Università del Maryland, ha sviluppato infrastrutture fondamentali quali l'API di distribuzione dei modelli, i controlli di accesso basati sui ruoli e le pipeline di supporto per le prove. Elyas lavora inoltre a stretto contatto con il team di ricerca su progetti quali la robustezza agli attacchi avversari, l'interpretabilità dei modelli e il rilevamento di contenuti misti eterogenei. Al di fuori del lavoro, Elyas ama dedicarsi a una vasta gamma di attività creative ed espressive, tra cui la realizzazione di film, la lettura e l'esplorazione della città.

Bradley è un ricercatore nel campo dell'intelligenza artificiale ed esperto nella creazione di prodotti di deep learning nel settore industriale. Recentemente ha guidato il gruppo di ricerca sul deep learning presso Absci, un'azienda che si occupa di scoperta di farmaci tramite intelligenza artificiale generativa, e in precedenza è stato membro del team principale di visione artificiale presso Tesla Autopilot.
Durante gli studi universitari, Bradley ha pubblicato diversi articoli sulla ricerca nel campo del deep learning con lo Stanford Vision Lab. Ha conseguito una laurea in fisica e un master in intelligenza artificiale presso la Stanford University. Oltre all'intelligenza artificiale, è appassionato di educazione e filosofia ed è un avido giocatore di golf.






