Proofigとの新たな提携を発表!詳細はこちら
要約:学術関係者やコンテンツ モデレーターは 、AI検出ツールやAIチェッカーの評価を再考すべきである。2023年に学術論文や一般メディアで形成された従来のコンセンサスは時代遅れだ。Pangramのような最新のAI検出モデルは、最新のLLMに追いついただけでなく、将来を見据えて構築されている。
2022年にChatGPTが登場すると、作家やコンテンツ制作者たちはこの新たな人工知能ツールに殺到し、創作活動に活用し始めた。その流れは今も止まらない。クリエイターたちはChatGPT(および他のAIモデル)とその競合ツールを活用し、研究論文や小説といった大規模な文書から、メール、Redditのコメント、Amazonのレビューといった短い文章まで、あらゆるものを執筆した。AI生成コンテンツがインターネットに溢れかえった。 しかし大規模言語モデル(LLM)の登場以来、人間が書いたものとAIが書いたものを区別する需要が生まれました。OpenAIはこのニーズを認識し、テキストをAI生成と判定する製品を開発しました。AIの普及が進むにつれ、特に学術的誠実さが最優先される学校や大学では、AI検出ツールや分類ツールへの需要が高まりました。一部の学生(多くの場合アーリーアダプター)は最新のモデルを利用して課題を終え、試験を受け、大学出願まで行いました。 時間的制約下にある研究者の中には、手抜きをしてAI生成またはAI支援の論文を出版物に提出する者も現れた。こうした懸念に対処すべく、多くのツールが投入された。既存の教育顧客向けに、TurnItInのような学術ソフトウェア大手は2023年4月に「AI Checker」をリリース。 Grammarlyも2024年に「Grammarly Authorship」を発表した。 これらの企業の共通認識は、自社のツールが剽窃を検出できるなら、AI生成物も同様に検出できるはずだというものであった。特に高等教育機関では、「剽窃検出ツール」から「AI検出ツール」への移行が必要とされた。しかし、このアプローチが機能しないことは早い段階で明らかになった。
初期の AI 検出器は、パープレキシティとバースト性を使用して精度を約束していました。Pangram の CTO、ブラッドリー・エミ氏はこれらの用語について次のように説明しています。「パープレキシティとは、テキスト中の各単語がどれほど予想外、つまり驚くべきものであるかを表します。バースト性とは、文書全体におけるパープレキシティの変化を表します。文書全体に驚くべき単語やフレーズが散りばめられている場合、そのバースト性は高くなります。
これらの用語に縛られるつもりはないが、AI検出ツールを作成する際にこれらの要素に過度に依存すると、常に三つの欠陥が生じる:
学術機関にとって特に深刻な懸念事項である。学生や研究者を研究や論文におけるAI使用で誤って告発することの重みは計り知れない。キャリアを台無しにする可能性がある。AIをフィルタリングするツールの精度が95%であっても、それに依存することは極めて危険だ。 したがって、MIT、ヴァンダービルト大学、カリフォルニア大学バークレー校など多くのトップ学術機関は、教員によるAI検出ツールの使用を支持していません。多くの場合、彼らは『AI生成テキスト検出ツールの検証』のような、AI検出ツールの性能がいかに低いかを明らかにした具体的な研究論文や、『AIライティング検出ツールが機能しない理由』といった業界記事を根拠として挙げています。
OpenAIはこれらの課題を非常に困難と判断し、2023年7月にAIテキスト分類ツールの開発を断念した。その理由として「AI分類ツールは精度が低いため、利用できなくなりました」と説明している。多くの学校管理者は結論に至った:OpenAIでさえ実現できないなら、おそらく不可能だろうと。
トップ大学と一般社会がAI検出の有効性は不可能、あるいは単なる詐欺だと結論づける中、Pangram Labsのような企業はこの分野で大幅な改良を実現し、大学や企業環境においてAI検出を重要なツールへと変えた。
AI検出は、近道を探す学生と、人間が書いたものとそうでないものを選別しようとする教育者との間の軍拡競争とよく呼ばれる。2025年、検出器は賭け金を引き上げた。
2025年8月、シカゴ・ブース校の研究者ブライアン・ジャバリアンとアレックス・エミは論文を発表した。 人工的ライティングと自動検出において、「ほとんどの商用AI検出器は驚くほど高い性能を発揮しており、特にPangramは偽陽性率と偽陰性率がほぼゼロに近い」と述べている。彼らはPangramを「厳格なポリシー上限(偽陽性率≤0.005)を満たしつつ、AIテキストを正確に検出する能力を損なわない唯一の検出器」と位置付けている。 これはわずか数年でAI検出技術がどれほど進歩したかを示す一例である。では、なぜこのような進展が起きたのか?
まず、AI研究者は、より広範な人間のテキストとAI生成テキストを収集することでデータセットを改善してきた。これには学術論文だけでなく、メールや記事などの他の文章も含まれる。次に、開発者は偽陽性率を低減するために能動的学習を採用している。つまり、AIか人間か分類が最も難しいテキストを特定し、それをモデルに再統合する手法である。
そしてこの軍拡競争において、汎用AI開発者はAI検出ツールを突破するほど十分な対応をしていない。OpenAIが大々的に発表したGPT-5は、幻覚現象の低減、トーンの強化、より創造的な文章生成を約束していた。 しかし12時間以内に、Pangram Labsの共同創業者マックス・スペロはLinkedInで、追加トレーニングなしでPangramのAI検出ツールがGPT-5のテストを従来モデルと同等の精度で分類できると投稿した:
「Pangramは、明示的に訓練されなくてもGPT-5を確実に検出できる唯一のAI検出器である。」
AI検出器の使用には真摯な懸念がある。多くの検出器は依然として驚くべき誤検知率を示し、精度を偽って宣伝している。しかし、最新技術の一部は驚くほど信頼性が高く、企業や大学で積極的に導入が進められている。 例えば、専門家調達企業Qwotedは最近、AI検出機能をワークフローに統合し、「専門家」によるAI生成の見積もりを削減した。「ジャーナリズムの未来は信頼にかかっている。だからこそ、AI検出と帰属判定のゴールドスタンダードを確立したPangramとの提携を喜んでいる」
研究者やジャーナリストも再び注目し始めている。長年の批判派も見解を改め、AI検出をより広範なAI政策に組み込む方法を模索している。プレス・ガゼットのロブ・ウォウは最近、AI生成文章を見抜きたいユーザーにPangramを推奨した。「こうしたツールは100%信頼できるわけではないが、Pangramは他のオンラインAIチェッカーと比べて精度が高いと評価されており、Qwotedなどのジャーナリスト対応サービスに統合され、AI生成の企画書や原稿を検出している」
貴社のユースケースについてお話しし、Pangramが組織にとって有益かどうかを検討したいと考えています。ぜひお試しいただき、エンタープライズ向けサービスについてお問い合わせください。