製品の更新情報

AI検出ツールはGPT-4.5を見破れるのか？

エライアス・マスルおよびブラッドリー・エミ

2025年2月27日

AI検出ツールはGPT-4.5を見抜けるか？ | Pangram Labs

GPT-4.5がリリースされました

本日、OpenAIはGPT-4.5を公開しました。これは現在利用可能な最新かつ最大規模の最先端言語モデルであり、ChatGPTにとって重要なアップデートとなります。DeepSeek R1やOpenAI O3といった推論モデルに匹敵するベンチマーク数値は達成できていませんが、GPT-4.5は今年に入ってから最も大規模かつ期待されていたモデルのリリースであり、私たちも早速試してみるのを楽しみにしています。 OpenAIは文章の質が大幅に向上したと主張しており、その性能に関する熱い議論がすでにソーシャルメディア上で飛び交っています。

AI検出ツールは、新しいモデルの登場ペースについていけるのか？

多くの人が抱く疑問、「モデルの性能が向上するにつれ、GPT-4.5でもAI生成テキストを見分けられるのか？」に答えたいと考えました。そこで、その答えを探るため、本日簡単なテストを実施しました。

パングラム対他社

まず、ChatGPTに尋ねるような日常的なライティングタスクを代表する11のプロンプトを抽出して分析しました。

以下が、私たちが使用したプロンプトです：

ペルーにおけるコアラの保護活動について、300語程度のエッセイを書いてください
私の新聞でのリベラル寄りの論説を終了することについて、私のチームに説明するメールを作成してください。差出人を「アーガイル・J・バギンズ」とし、宛先を「ワシントン・モスト」のスタッフ宛としてください。
世界初の常温半導体（今回はマジで）を発表する400語の要約を書いてください。必要に応じて、名前や研究所名はでっち上げてください
小学生の視点から、学校での制服着用を義務化すべきではないという説得力のある小論文を書きなさい
詩や窓の外の蝶に興味を持つ12歳の少女が、複雑な心境を綴った日記を書いてください
メリーランド州ボルチモアにある『アラビアン・ナイト』をテーマにした脱出ゲームについて、ロバートという名のスタッフが担当し、セットデザインが素晴らしいという点を踏まえて、詳細なレビューを書いてください
ロシア発のアンダーグラウンド・インディーズ映画のヒット作の監督が、制裁下にあってもコンペティションへの参加を認めてほしいと、アカデミー賞の幹部たちに懇願する説得力のあるメールを作成してください。必要であれば、詳細を創作しても構いません
小説の一場面として、若者の主人公たちが、意図的に失敗するように設計されたNASAのシミュレーションの中で、火星用の装甲航空機を着陸させようと苦闘する様子を描いた創作小説を書きなさい
ニューヨークの金融業界で働く金欠の男が、フロリダのUberドライバーに遠隔で懇願し、ハリケーン被害を受けやすい安アパートから自分のコモドオオトカゲを救い出してもらうという映画のシーンの脚本を書いてください
ハロウィンの夜、仮装をした若いカップルが別れる様子を描いた詩を書いてください。ユーモアを交えて、200語以内で。
ヴェネツィアを舞台に、危うく揺れ動く貴重な絵画を追って、ホバーバイクによる追跡劇を描く創作小説を書いてください

プロンプトは可能な限り多様で幅広いものにするよう努めたほか、以前のGPTモデルとは質的に大きな違いが際立つようなプロンプトを作成するよう心がけました。つまり、モデルが創造性を発揮し、「驚き」の要素を見せられる機会があれば、GPT-4.5にその機会を最大限に与えるよう最善を尽くしたのです。

結果 – AI検出ツール対GPT-4.5

プロンプト	パングラム	主要な競合他社1	主要な競合他社2
コアラの保護	100%	100%	100%
新聞のメール配信	100%	100%	67%
常温半導体	100%	56%	86%
学校制服	85%	100%	80%
詩の日記	100%	100%	15%
脱出ゲームのレビュー	100%	81%	56%
ロシア映画に関するメール	100%	100%	91%
火星着陸の模様	100%	43%	7%
コモドオオトカゲの脚本	98%	88%	0%
ハロウィーンの別れの詩	100%	100%	0%
ヴェネチアの追跡シーン	100%	49%	9%

Pangramは、トレーニングセットにGPT-4.5のデータが一切含まれていなくても、GPT-4.5によって書かれた11編のエッセイすべてを検出することができました。これに対し、主要なAI検出競合製品2社は、せいぜい不安定な結果しか示せない。Pangramは11件のサンプルのうち10件について、98%以上の確率でAI生成であると確信を持って予測できるのに対し、競合製品はしばしば高い不確実性を示したり、最悪の場合、そのテキストが人間によって生成されたものであると高い確信を持って予測したりする。

なぜパングラムは新しいモデルに対してこれほどうまく一般化できるのでしょうか？

Pangramは、人間およびAIが生成したテキストの何百万もの例を学習した大規模な機械学習モデルそのものです。大規模なモデルは一般化能力に優れており、他のモデルでは捉えきれないAI生成テキストの微妙なパターンも検出することができます。当社のアクティブラーニングアプローチは、感度を高めつつ誤検知率をさらに低減させるため、モデルは大規模な環境でも良好に動作し、競合他社よりもはるかに効果的に新しいLLMへ汎化することができます。さらに、データの品質と多様性に重点を置くことで、他のモデルでは捉えきれない微細な詳細を理解する能力において、はるかに豊富な経験を持つモデルを実現しています。

結論 – AI検出ツールはGPT-4.5に対してもまだ有効なのか？

はい、当社のAI検出ツールは、GPT-4.5によって生成されたテキストの検出において、依然として高い効果を発揮しています。

もし、より高性能で優れた新型モデルが登場した際にPangramがどれほど通用するのかと懸念されているなら、Pangramは再学習を一切行わずに、ここしばらくで最も注目されているAIモデルのテストをクリアしています。OpenAIがモデルを更新した際に、AI検出ソフトが突然機能しなくなるのを避けたいなら、今すぐPangramをお試しください。

当社の研究に関する詳細情報、またはGPT-4.5で当社のモデルをお試しいただける無料クレジットについては、info@pangram.com までお問い合わせください。

エライアス・マスル創業エンジニア

Elyas Masrourは、Pangramの創業エンジニアです。メリーランド大学を卒業後、Pangramの2人目の社員として入社して以来、モデル提供API、ロールベースのアクセス制御、証拠パイプラインのサポートなど、重要なインフラの構築に携わってきました。また、Elyasは研究チームと密接に連携し、敵対的攻撃に対する堅牢性、モデルの解釈可能性、異種混合コンテンツの検出といったプロジェクトに取り組んでいます。仕事以外では、映画制作や読書、街の探索など、人間の創造性や表現の幅広い分野を楽しんでいます。

Elyas Masrour のその他の記事

ブラッドリー・エミ最高技術責任者（CTO）、共同創業者

ブラッドリーはAI研究者であり、産業界におけるディープラーニング製品の構築の専門家です。最近では、生成AIを活用した創薬企業であるAbsciでディープラーニング研究グループを率いており、それ以前はテスラのオートパイロット部門におけるコアコンピュータビジョンチームのメンバーでした。

大学院生時代、ブラッドリーはスタンフォード・ビジョン・ラボに所属し、ディープラーニング研究に関する複数の論文を発表しました。スタンフォード大学で物理学の学士号と人工知能の修士号を取得しています。AI以外にも、教育や哲学に関心を持ち、熱心なゴルファーでもあります。

ブラッドリー・エミのその他の記事

関連記事

パングラムは「クロード・ソネット第5篇」を検出できるか？

製品の更新情報

パングラムは「クロード・ソネット第5篇」を検出できるか？

Anthropicは本日、「Claude Sonnet 5」をリリースしました。Pangramがこのモデルの出力を検出できることを、皆様にお知らせできることを嬉しく思います！

キャサリン・タイ2026年6月30日

Pangram 3.0：テキストにおけるAI編集の程度を定量化

製品の更新情報

Pangram 3.0：テキストにおけるAI編集の程度を定量化

AI支援検知機能を搭載したPangram新モデルの技術概要

キャサリン・タイ2025年12月11日

ヒューマナイザーとは何ですか？

製品の更新情報

ヒューマナイザーとは何ですか？

先週、PangramがAIによる「ヒューマナイザー」を検出できるようになったことを発表しました。しかし、皆さんは「ヒューマナイザーとは何なのか？」「誰を対象としているのか？」と疑問に思われているかもしれません。

エライアス・マスル2025年1月27日

AI検出ツールはGPT-5に対しても有効なのか？

製品の更新情報

AI検出ツールはGPT-5に対しても有効なのか？

PangramはGPT-5をどの程度正確に検出できるのか？ここでは、Pangramが他のAI検出ツールと比べてどの程度の性能を発揮するかを見ていきます。

ブラッドリー・エミ2025年8月7日

パングラム・テキストの更新：GPT-4o、Claude 3、LLaMA 3

製品の更新情報

パングラム・テキストの更新：GPT-4o、Claude 3、LLaMA 3

本日、市場に登場する新しいLLMに迅速に対応できる当社の技術力を皆様にご紹介できることを嬉しく思います。今回リリースしたモデルのアップデートにより、GPT-4o、Claude 3、LLaMA 3で生成されたAIテキストを、ほぼ完璧な精度で検出できるようになりました。

ブラッドリー・エミ2024年5月22日

パングラムのAIフレーズのご紹介

製品の更新情報

パングラムのAIフレーズのご紹介

注意深く読み込めば、その文章がAIによって書かれたことを示唆する手がかりがしばしば見つかるものです。

エライアス・マスル2025年2月14日

を購読して、最新情報を受け取りましょう

最新のニュースやお得な情報をお見逃しなく。

soc2

SOC2 タイプ2

AssuranceLabによる検証済み

© 2025 Pangram. 全著作権所有。

info@pangram.com

コミュニティに参加しましょう

© 2025 Pangram. 全著作権所有。