Annunciamo una nuova partnership con Proofig! Per saperne di più
Oggi OpenAI ha rilasciato GPT-4.5: l'ultimo e più avanzato modello linguistico disponibile, nonché un importante aggiornamento di ChatGPT. Pur non raggiungendo statistiche di riferimento paragonabili a modelli di ragionamento come DeepSeek R1 e OpenAI O3, GPT-4.5 rappresenta il modello più grande e atteso dell'anno fino ad ora, e siamo entusiasti di provarlo. OpenAI sostiene che ci siano grandi miglioramenti nella qualità della scrittura e sui social media si trovano già commenti entusiastici sulle sue prestazioni.
Volevamo rispondere alla domanda che molti si pongono: con il miglioramento dei modelli, è ancora possibile rilevare i testi generati dall'IA con GPT-4.5? Oggi abbiamo eseguito un rapido test per scoprirlo.
Abbiamo iniziato campionando 11 prompt indicativi delle attività di scrittura quotidiane che si potrebbero richiedere a ChatGPT.
Ecco i suggerimenti che abbiamo utilizzato:
Abbiamo cercato di rendere i prompt il più possibile diversificati e vari, e inoltre abbiamo cercato di scrivere prompt che mostrassero una differenza qualitativa significativa rispetto ai precedenti modelli GPT: in altre parole, se c'era la possibilità per il modello di essere creativo e mostrare il fattore "wow", abbiamo fatto del nostro meglio per offrire a GPT-4.5 questa opportunità.
| Sollecito | Pangram | Principale concorrente 1 | Principale concorrente 2 |
|---|---|---|---|
| Conservazione dei koala | 100% | 100% | 100% |
| E-mail del giornale | 100% | 100% | 67% |
| Semiconduttore a temperatura ambiente | 100% | 56% | 86% |
| Divise scolastiche | 85% | 100% | 80% |
| Diario di poesia | 100% | 100% | 15% |
| Recensione Escape Room | 100% | 81% | 56% |
| Film russo Email | 100% | 100% | 91% |
| Scena dell'atterraggio su Marte | 100% | 43% | 7% |
| Komodo Dragon Script | 98% | 88% | 0% |
| Poema di rottura di Halloween | 100% | 100% | 0% |
| Scena dell'inseguimento a Venezia | 100% | 49% | 9% |
Pangram è in grado di rilevare tutti gli 11 saggi scritti con GPT-4.5, anche senza alcun dato GPT-4.5 nel set di addestramento. In confronto, i due principali concorrenti nel campo del rilevamento dell'IA presentano risultati discontinui nella migliore delle ipotesi. Mentre Pangram è in grado di prevedere con sicurezza che 10 degli 11 campioni hanno una probabilità di essere generati dall'IA pari o superiore al 98%, la concorrenza spesso esprime un alto grado di incertezza o, nel peggiore dei casi, prevede con elevata sicurezza che il testo sia stato generato da un essere umano.
Pangram è di per sé un grande modello di apprendimento automatico che ha visto milioni di esempi di testi generati sia dall'uomo che dall'intelligenza artificiale. I modelli di grandi dimensioni tendono a generalizzare meglio e a cogliere modelli sottili nei testi generati dall'intelligenza artificiale che altri non sono in grado di cogliere. Il nostro approccio di apprendimento attivo riduce ulteriormente il tasso di falsi positivi aumentando al contempo la nostra sensibilità, consentendo al modello di funzionare bene su larga scala e di generalizzare a nuovi LLM in modo molto più efficace rispetto ai nostri concorrenti. Inoltre, la nostra attenzione alla qualità e alla diversità dei dati si traduce in un modello che ha molta più esperienza nella comprensione dei dettagli più sottili che altri modelli non sono in grado di cogliere.
Sì, il nostro strumento di rilevamento basato sull'intelligenza artificiale è ancora altamente efficace nel rilevare il testo generato da GPT-4.5.
Quindi, se vi state chiedendo come si comporterà Pangram quando uscirà un nuovo modello più grande e migliore, Pangram supera il test con la versione di IA più attesa che abbiamo visto da tempo, senza alcuna riqualificazione. Se non volete che il vostro software di rilevamento dell'IA smetta improvvisamente di funzionare la prossima volta che OpenAI aggiornerà il proprio modello, provate Pangram oggi stesso.
Per ulteriori informazioni sulla nostra ricerca o per ottenere crediti gratuiti per provare il nostro modello su GPT-4.5, contattaci all'indirizzo info@pangram.com.
