Proofigとの新たな提携を発表!詳細はこちら
本日、OpenAIはGPT-4.5をリリースしました。これは現在利用可能な最新かつ最大規模のフロンティア言語モデルであり、ChatGPTの重要なアップデートとなります。DeepSeek R1やOpenAI O3といった推論モデルに匹敵するベンチマーク統計値は達成していませんが、GPT-4.5は今年最大の注目モデルリリースであり、我々はこれを試すことに興奮しています。 OpenAIは文章品質の大幅な向上を主張しており、その性能に関する即席の分析が既にソーシャルメディア上に溢れている。
多くの人が疑問に思う質問に答えたいと考えました:モデルが進化する中で、GPT-4.5でAI生成テキストを検出することはまだ可能でしょうか? それを確かめるため、本日簡単なテストを実施しました。
私たちはまず、ChatGPTに尋ねられる日常的なライティングタスクを示す11のプロンプトをサンプリングすることから始めました。
以下が使用したプロンプトです:
プロンプトは可能な限り多様性に富むものとするよう努めるとともに、従来のGPTモデルとは質的に大きく異なる特性を発揮できるプロンプトの作成にも注力しました。つまり、モデルが創造性を発揮し「驚き」の要素を見せられる機会があれば、GPT-4.5にその機会を最大限に与えるよう配慮したのです。
| プロンプト | パングラム | 主要競合他社1 | 主要競合他社2 |
|---|---|---|---|
| コアラ保護 | 100% | 100% | 100% |
| 新聞メール | 100% | 100% | 67% |
| 常温半導体 | 100% | 56% | 86% |
| 制服 | 85% | 100% | 80% |
| 詩の日記 | 100% | 100% | 15% |
| 脱出ゲームレビュー | 100% | 81% | 56% |
| ロシア映画メール | 100% | 100% | 91% |
| 火星着陸シーン | 100% | 43% | 7% |
| コモドドラゴン・スクリプト | 98% | 88% | 0% |
| ハロウィーン別れの詩 | 100% | 100% | 0% |
| ヴェネツィアの追跡シーン | 100% | 49% | 9% |
パングラムは、トレーニングセットにGPT-4.5データが一切含まれていない場合でも、GPT-4.5で書かれた全11のエッセイを検出可能です。 一方、主要なAI検出ツール2社は、せいぜい不完全な結果しか示せない。Pangramが11サンプル中10件を98%以上のAI生成確率で確実に予測できるのに対し、競合ツールは高い不確実性を示すことが多く、最悪の場合、人間が書いたテキストだと高い確信度で予測してしまう。
パングラム自体は、人間とAIが生成したテキストの何百万もの例を学習した大規模な機械学習モデルです。大規模なモデルは一般化能力に優れ、他のモデルでは捉えられないAI生成テキストの微妙なパターンを検出します。 当社のアクティブラーニング手法は、感度を高めつつ誤検知率をさらに低減させるため、大規模環境でも効果的に機能し、競合他社よりもはるかに効率的に新たなLLMへ汎化できます。さらに、データ品質と多様性への注力により、他社モデルが捉えられない微細な差異を理解する経験値を大幅に蓄積したモデルを実現しています。
はい、当社のAI検出ツールはGPT-4.5で生成されたテキストの検出において、依然として高い効果を発揮します。
では、より新しく、より大きく、より優れたモデルが登場した際にPangramがどれほど良好に機能するか気になっている方へ。Pangramは、再トレーニングを一切行わずに、ここしばらくで最も期待されたAIリリースのテストをクリアしました。OpenAIがモデルを更新した際にAI検出ソフトウェアが突然機能しなくなる事態を避けたいなら、今すぐPangramをお試しください。
当社の研究に関する詳細情報や、GPT-4.5モデルを無料でお試しいただけるクレジットについては、info@pangram.com までお問い合わせください。