製品の更新情報

Pangramはヒューマナイザーに対してどの程度の性能を発揮するのか？（2025年8月更新）

ブラッドリー・エミ

2025年8月27日

目次

パングラムのヒューマナイザーの最新の結果
人間らしいAI生成テキストに対して、Pangramは他のAI検出ツールと比べてどうでしょうか？
テキストが人間らしく書き換えられているかどうか、どうすれば分かるでしょうか？
捻じ曲げられた言葉
不自然な間隔のエラー
よく使われるフレーズ
特殊文字
執筆プロセスのツール
なぜパングラムは、人間らしいAI生成テキストに対して100%正確ではないのでしょうか？
今後、Pangramのヒューマナイザーの性能は向上していくのでしょうか？

Pangramはヒューマナイザーに対してどの程度の性能を発揮するのか？（2025年8月更新）

AI検出は、大規模言語モデル、検出ツール、そして「ヒューマナイザー」の間で行われる「軍拡競争」とよく形容される。ヒューマナイザーとは、AIが生成したテキストを難読化し、意図的に誤りを加えることで、生成されたテキストを人間が書いたように見せかけることを目的とした、オンライン上のツールの一種である。

パングラムでは、常に時代の最先端を行き、新モデルやヒューマナイザーにおける最新の技術進歩に迅速に対応しています。これにより、信頼性の高いAI検知機能を実現しています。

2025年1月、当社は19種類のヒューマナイザーおよびパラフレーズツールを検証した技術レポートの更新版を公開しました。主な調査結果は以下の通りです：

パングラムは、人間化ツールや言い換えツールに対して高い耐性を持っています
人間による校正者の中には、スペースや句読点の間隔に意図的に誤りを加えたり、同義語を一つ一つ置き換えたりする者もいます。
その他の人間味を加えるツールには、テキストを人間らしい表現で言い換えるよう訓練された、微調整済みの大規模言語モデル（LLM）自体も含まれます。
ヒューマナイザー処理されたテキストの読みやすさや流暢さが高ければ高いほど、Pangramによって検出される可能性が高くなります。
言い換えれば、流暢さの観点から「良い」ヒューマナイザーは検出されやすく、「悪い」ヒューマナイザーは検出されにくいということだ。

しかし、ヒューマナイザーの分野は急速に進化しているため、最新のヒューマナイザー・ベンチマークに関する最新データを公開したいと考えました。

パングラムのヒューマナイザーの最新の結果

ヒューマナイザー	正確性
Ahrefs	100.0%
aihumanizer.com	100.0%
GPTをバイパスする	99.7%
ディッパー	97.6%
ゴーストAI	100.0%
GPTinf	99.2%
Grammarly	100.0%
humanizeai.io	93.8%
humanizeai.pro	100.0%
完了しました	93.5%
Quillbot	100.0%
Scribbr	99.0%
半人間型AI	100.0%
スモディン	100.0%
StealthGPT	95.6%
サーファーSEO	100.0%
surgegraph.io	100.0%
TwainGPT	92.7%
検知不能なAI	90.3%
Writesonic AI	98.1%

Pangramは、私たちがテストした主要なヒューマナイザーのすべてにおいて、90%以上の精度を示しています。

人間らしいAI生成テキストに対して、Pangramは他のAI検出ツールと比べてどうでしょうか？

Russellらによる研究では、PangramがGPTZeroやいくつかのオープンソース手法と、人間が作成したテキストを用いて比較評価されている。人間が作成したテキストに対するPangramの最良モデルの精度は97%であるのに対し、GPTZeroは46%、FastDetectGPTは23%、Binocularsは7%であった。

他の検出器と比較した、Pangramの人間的なテキストに対する性能

JabarianとImasによるごく最近の研究によると、4つの商用検出器の中で、ヒューマナイザーに対して頑健な性能を発揮するのはPangramだけであることが判明した：

長い文章の場合、PangramはAI生成テキストをほぼ100%検出します。文章が短くなるにつれてFNRは若干上昇しますが、それでも低い水準を維持しています。他の検出器は、ヒューマナイザーに対してはそれほど頑健ではありません。 Originality.AIのFNRは、長いテキストでは約0.05まで上昇しますが、ジャンルやLLMモデルによっては、短いテキストでは最大0.21に達することもあります。GPTZeroは、ほとんどのジャンルやLLMモデルにおいてFNRスコアが0.50以上となり、AI生成テキストを検出する能力をほぼ失っています。RoBERTaも同様に低調で、全体的に高いFNRスコアを示しています。

テキストが人間らしく書き換えられているかどうか、どうすれば分かるでしょうか？

テキストがヒューマナイザーにかけられたかどうかは、目視でいくつかの点から判断できます。

捻じ曲げられた言葉

「ヒューマナイザー」を見抜く最も簡単な方法の一つは、「不自然な言い回し」を探すことです。これは、盗用を隠蔽するために不自然に置き換えられた同義語のことです。GrammarlyやQuillbotといったワードスピナーツールは、AIが登場する以前から、盗用を隠蔽するためにこうした同義語置換アルゴリズムを使用してきました。

不自然な言い回しの例としては、「人工知能」の代わりに「偽りの意識」と言ったり、「乳がん」の代わりに「胸の危機」と言ったりすることが挙げられます。昨年、「マーティン・ルーサー・キング・ジュニア」の代わりに「マーティン・ルーサー・ルーラー・ジュニア」と書かれた学生の作文があったという、面白い事例を耳にしました。

人間らしいAI生成テキストを見分ける唯一の手段として、不自然な表現に注意を払うことは重要ですが、不自然な表現は、非ネイティブの英語話者が特定の単語の直接的な意味や一般的な用法を理解し損ねたり、誤用したりした場合にも、非ネイティブの文章によく見られるものです。

不自然な間隔のエラー

ヒューマナイザーは、スペースを追加したり削除したりすることで、AI検出ツールのトークナイザーを欺こうとすることがよくあります。特に、文と文の間のスペースを削除する手法がよく見られます。

よく使われるフレーズ

人間味を加えたAI生成テキストであっても、人間味のないAI生成テキストと同様の繰り返し表現が見られる。同じ文書内で不自然な表現が2回も現れる場合、そのテキストが「ヒューマナイザー」によって生成されたものであることが特に明白となる。なぜなら、それはヒューマナイザーが体系的に同じ類義語置換を行っている証拠だからだ。

特殊文字

また、ヒューマナイザーは通常、AI検出ツールのトークナイザーを欺くために、非標準のUnicode文字を使用します。その一例として、通常のスペースの代わりに「U+2009」（「半角スペース」を表すUnicode文字）を使用する、よく知られたヒューマナイザーがあります。コピー＆ペーストした文字列の中に隠れている可能性のある、すべての非表示文字を確認できるウェブサイトhttps://www.soscisurvey.de/tools/view-chars.phpを推奨します。

人間味のある文章における非表示文字の例

執筆プロセスのツール

Google ドキュメントのPangramの新しい「ライティング再生」機能を使えば、Google ドキュメント内のテキストの大部分が手入力ではなく、コピー＆ペーストされたものかどうかを確認することもできます。Google ドキュメントにおけるAI検出機能の詳細については、こちらをご覧ください。

コピーと貼り付けを示す書き込み再生の例

なぜパングラムは、人間らしいAI生成テキストに対して100%正確ではないのでしょうか？

パングラムが、人間らしいAI生成テキストに対して完璧な検出器ではないのには、いくつかの理由があります。

Pangramは、誤検知率（False Positive Rate）については決して妥協しません。当社の内部モデルのいくつかは、ヒューマナイザーをほぼ完璧な精度で検出できますが、その一方で誤検知率が高くなりがちです。ヒューマナイザーの出力をすべて捕捉することよりも、本物の人間の文章が決してAIとしてフラグ付けされないようにすることの方が重要であるため、当社はこれらのモデルを公開していません。
質の極めて低い「ジャンク」テキストは、目視ですぐに見分けがつきます。 Most of the cases in which Pangram does not catch humanized output, the text is so badly garbled and obfuscated that it barely resembles English. These cases are easy to spot by eye, but are hard to catch algorithmically because there are infinitely many ways to produce gibberish. We would rather descope gibberish than try to detect it, as it is not even well-posed to try to distinguish human gibberish from humanizer gibberish.

今後、Pangramのヒューマナイザーの性能は向上していくのでしょうか？

はい、ヒューマナイザーの検出はPangramにとって現在注力している研究分野であり、今後もこれらのヒューマナイザーの特性を解明し、ヒューマナイザーの出力を検出するための研究成果を公表していきたいと考えています。Pangramが学術的誠実性の分野において信頼できるツールとして認められるためには、大規模言語モデルから直接コピー＆ペーストされたテキストだけでなく、こうした不正ツールによって生成されたテキストも検出できる必要があります。

PangramのAI検出ツールを使って、Humanizerの出力結果とご自身の文書を比較してみてください。

ブラッドリー・エミ最高技術責任者（CTO）、共同創業者

ブラッドリーはAI研究者であり、産業界におけるディープラーニング製品の構築の専門家です。最近では、生成AIを活用した創薬企業であるAbsciでディープラーニング研究グループを率いており、それ以前はテスラのオートパイロット部門におけるコアコンピュータビジョンチームのメンバーでした。

大学院生時代、ブラッドリーはスタンフォード・ビジョン・ラボに所属し、ディープラーニング研究に関する複数の論文を発表しました。スタンフォード大学で物理学の学士号と人工知能の修士号を取得しています。AI以外にも、教育や哲学に関心を持ち、熱心なゴルファーでもあります。

ブラッドリー・エミのその他の記事

関連記事

「パングラム 3.3」のご紹介！

製品の更新情報

「パングラム 3.3」のご紹介！

最新のAI検出ツール「Pangram 3.3」をご紹介します。人間らしい文章に対する検出精度が向上し、ESL（英語を第二言語とする）の文章における誤検知率もさらに低減されています。

キャサリン・タイ2026年5月13日

パングラム・テキストの更新：GPT-4o、Claude 3、LLaMA 3

製品の更新情報

パングラム・テキストの更新：GPT-4o、Claude 3、LLaMA 3

本日、市場に登場する新しいLLMに迅速に対応できる当社の技術力を皆様にご紹介できることを嬉しく思います。今回リリースしたモデルのアップデートにより、GPT-4o、Claude 3、LLaMA 3で生成されたAIテキストを、ほぼ完璧な精度で検出できるようになりました。

ブラッドリー・エミ2024年5月22日

AI識別機能の発表：PangramはさまざまなLLMを区別することができます

製品の更新情報

AI識別機能の発表：PangramはさまざまなLLMを区別することができます

当社の最新モデルは、AI生成コンテンツを高精度で検出できるだけでなく、GPT-4、Claude、Geminiといった異なるLLMによって生成されたコンテンツを区別することも可能です。

ブラッドリー・エミ2025年2月11日

LoRAを活用したスケールアップ

製品の更新情報

LoRAを活用したスケールアップ

先月、当社は自社のモデルを競合他社および主要な学術的手法と比較した包括的なベンチマーク結果をまとめた技術報告書を発表しました。

ブラッドリー・エミ2024年3月22日

ヒューマナイザーとは何ですか？

製品の更新情報

ヒューマナイザーとは何ですか？

先週、PangramがAIによる「ヒューマナイザー」を検出できるようになったことを発表しました。しかし、皆さんは「ヒューマナイザーとは何なのか？」「誰を対象としているのか？」と疑問に思われているかもしれません。

エライアス・マスル2025年1月27日

Google ドキュメントでAIを検出する方法

製品の更新情報

Google ドキュメントでAIを検出する方法

多くの教師が、Google ドキュメント上で直接生徒の文章指導を行っています。幸いなことに、Google ドキュメントではワンクリックでAI生成の文章かどうかを確認できる簡単な方法があります。

マックス・スペロ2025年1月31日

を購読して、最新情報を受け取りましょう

最新のニュースやお得な情報をお見逃しなく。

soc2

SOC2 タイプ2

AssuranceLabによる検証済み

© 2025 Pangram. 全著作権所有。

info@pangram.com

コミュニティに参加しましょう

© 2025 Pangram. 全著作権所有。