新着

Twitter、LinkedIn、Substackなどで、投稿が人間によるものかAIによるものかを即座に見分けられます。新しいChrome拡張機能をぜひお試しください。

詳細を見る
製品アップデート

AI検出ツールはGPT-4.5を検知できるのか?

AI検出ツールはGPT-4.5を検知できるか? | Pangram Labs

GPT-4.5 リリース

本日、OpenAIはGPT-4.5をリリースしました。これは現在利用可能な最新かつ最大規模のフロンティア言語モデルであり、ChatGPTの重要なアップデートとなります。DeepSeek R1やOpenAI O3といった推論モデルに匹敵するベンチマーク統計値は達成していませんが、GPT-4.5は今年最大の注目モデルリリースであり、我々はこれを試すことに興奮しています。 OpenAIは文章品質の大幅な向上を主張しており、その性能に関する即席の分析が既にソーシャルメディア上に溢れている。

AI検出器は新モデルのペースについていけるのか?

多くの人が疑問に思う質問に答えたいと考えました:モデルが進化する中で、GPT-4.5でAI生成テキストを検出することはまだ可能でしょうか? それを確かめるため、本日簡単なテストを実施しました。

パングラム対競合他社

私たちはまず、ChatGPTに尋ねられる日常的なライティングタスクを示す11のプロンプトをサンプリングすることから始めました。

以下が使用したプロンプトです:

  1. ペルーにおけるコアラ保護活動について、300語のエッセイを書いてください。
  2. ワシントン・モスト紙のスタッフ宛に、私の新聞でリベラル寄りの論説を終了させる旨を説明するメールを私に代わって書いてください。差出人はアーガイル・J・バギンズとしてください。
  3. 世界の初の常温半導体(今回は本当だ)を発表する400語の要旨を書いてくれ。必要なら名前や研究所はでっち上げても構わない。
  4. 小学生の視点から、制服の義務化に反対する説得力のあるエッセイを書きなさい
  5. 詩に興味を持つ12歳の少女が、窓の外の蝶々について綴った複雑な日記の記述
  6. メリーランド州ボルチモアにあるアラビアンナイトをテーマにした脱出ゲームについて、ロバートという名のスタッフが担当し、非常に優れたプロダクションデザインが施されている施設の詳細なレビューを執筆してください。
  7. ロシア発の地下インディーズ映画ヒット作の監督が、アカデミー賞の運営陣に宛てた説得力のあるメールを作成せよ。制裁下にあっても出品を許可するよう懇願する内容とし、必要なら細部は創作しても構わない。
  8. 小説の一場面として、若き主人公たちがNASAのシミュレーションで故障を想定した火星航空機の着陸に苦戦する創作小説を執筆せよ。
  9. ニューヨークの金欠金融マンが、フロリダのUber運転手に遠隔で懇願する映画シーンの台本を書く。ハリケーン被害の多い安アパートからコモドオオトカゲを救出してほしいと頼む内容。
  10. ハロウィンの夜、仮装した若いカップルが別れを告げる詩を書いてください。ユーモアを交えて、200語で。
  11. ヴェネツィアを舞台に、不安定に揺れ動く貴重な絵画を追跡するホバーバイクの追跡劇を描く創作小説を執筆せよ

プロンプトは可能な限り多様性に富むものとするよう努めるとともに、従来のGPTモデルとは質的に大きく異なる特性を発揮できるプロンプトの作成にも注力しました。つまり、モデルが創造性を発揮し「驚き」の要素を見せられる機会があれば、GPT-4.5にその機会を最大限に与えるよう配慮したのです。

結果 – AI検出ツール対GPT-4.5

プロンプトパングラム主要競合他社1主要競合他社2
コアラ保護100%100%100%
新聞メール100%100%67%
常温半導体100%56%86%
制服85%100%80%
詩の日記100%100%15%
脱出ゲームレビュー100%81%56%
ロシア映画メール100%100%91%
火星着陸シーン100%43%7%
コモドドラゴン・スクリプト98%88%0%
ハロウィーン別れの詩100%100%0%
ヴェネツィアの追跡シーン100%49%9%

Pangramは、トレーニングセットにGPT-4.5のデータが一切含まれていなくても、GPT-4.5によって書かれた11編のエッセイすべてを検出することができました。 これに対し、主要なAI検出競合製品2社は、せいぜい不安定な結果しか示せない。Pangramは11のサンプルのうち10つについて、98%以上の確率でAI生成であると確信を持って予測できるのに対し、競合製品はしばしば高い不確実性を示すか、最悪の場合、そのテキストが人間によって生成されたものであると高い確信を持って予測してしまう。

パングラムはなぜ新しいモデルへこれほどよく一般化できるのか?

パングラム自体は、人間とAIが生成したテキストの何百万もの例を学習した大規模な機械学習モデルです。大規模なモデルは一般化能力に優れ、他のモデルでは捉えられないAI生成テキストの微妙なパターンを検出します。 当社のアクティブラーニング手法は、感度を高めつつ誤検知率をさらに低減させるため、大規模環境でも効果的に機能し、競合他社よりもはるかに効率的に新たなLLMへ汎化できます。さらに、データ品質と多様性への注力により、他社モデルが捉えられない微細な差異を理解する経験値を大幅に蓄積したモデルを実現しています。

結論 – AI検出ツールはGPT-4.5でもまだ機能するのか?

はい、当社のAI検出ツールはGPT-4.5で生成されたテキストの検出において、依然として高い効果を発揮します。

では、より新しく、より大きく、より優れたモデルが登場した際にPangramがどれほど良好に機能するか気になっている方へ。Pangramは、再トレーニングを一切行わずに、ここしばらくで最も期待されたAIリリースのテストをクリアしました。OpenAIがモデルを更新した際にAI検出ソフトウェアが突然機能しなくなる事態を避けたいなら、今すぐPangramをお試しください。

当社の研究に関する詳細情報や、GPT-4.5モデルを無料でお試しいただけるクレジットについては、info@pangram.com までお問い合わせください。


エリヤス・マスルール
エライアス・マスル創業エンジニア

Elyas Masrourは、Pangramの創業メンバーであるエンジニアです。メリーランド大学を卒業後、Pangramの2人目の社員として入社して以来、モデル提供API、ロールベースのアクセス制御、証拠パイプラインのサポートなど、重要なインフラの構築に携わってきました。また、Elyasは研究チームと緊密に連携し、敵対的攻撃に対する堅牢性、モデルの解釈可能性、異種混合コンテンツの検出といったプロジェクトにも取り組んでいます。 仕事以外では、映画制作や読書、街の探索など、人間の創造性や表現の幅広い分野を楽しんでいます。

Elyas Masrourのその他の記事
ブラッドリー・エミ
ブラッドリー・エミ最高技術責任者(CTO)、共同創業者

ブラッドリーは、AI 研究者であり、業界におけるディープラーニング製品の構築の専門家です。最近では、創薬用生成AI企業であるAbsciでディープラーニング研究グループを率い、それ以前はTesla Autopilotのコアコンピュータビジョンチームのメンバーでした。

大学院生時代、ブラッドリーはスタンフォード大学ビジョンラボでディープラーニング研究に関する複数の出版物を執筆しました。スタンフォード大学で物理学の学士号と人工知能の修士号を取得しています。AI以外にも、教育や哲学にも情熱を注いでおり、熱心なゴルファーでもあります。

ブラッドリー・エミのその他の記事

関連記事

パングラム 3.0 API 移行ガイド
製品アップデート

パングラム 3.0 API 移行ガイド

2026年1月5日
パングラムテキスト更新:GPT-4o、Claude 3、LLaMA 3
製品アップデート

パングラムテキスト更新:GPT-4o、Claude 3、LLaMA 3

2024年5月22日
AIアシスト検出機能搭載のパングラム3.0のご紹介
製品アップデート

AIアシスト検出機能搭載のパングラム3.0のご紹介

2025年12月11日
パングラムは、AIコンテンツの識別において人間の専門家を上回る唯一のAI検出器である
製品アップデート

パングラムは、AIコンテンツの識別において人間の専門家を上回る唯一のAI検出器である

2025年1月29日
Google ドキュメントで AI を検出する方法
製品アップデート

Google ドキュメントで AI を検出する方法

2025年1月31日
第三者調査研究により、Pangramが最も堅牢なAI検出ツールであることが判明
製品アップデート

第三者調査研究により、Pangramが最も堅牢なAI検出ツールであることが判明

2024年10月30日