これはAIが書いたもの? テキストが生成されたものかどうかを確認する4つの方法

アレックス・ロイトマン
2026年3月12日

最近、私たちのほとんどが、あまりにも機械的で、魂が感じられず、あるいは不自然で、思わず「これ、AIが書いたんじゃないの?」と思ってしまうような文章を読んだことがあるでしょう。ChatGPTのようなAIツールがますます普及するにつれ、人間と機械による文章の境界線はますます曖昧になっていくでしょう。

たとえ「直感」で何かがAIによって生成されたと感じたとしても、学術的誠実性や採用判断が危うくなる可能性があります。ある文章がAIによって生成されたというあなたの直感は間違っている可能性があり、もしそうであれば、その直感によって誰かが不利益を被る恐れがあります

特定のテキストがAIによって作成されたものかどうかを判断するための、実証済みの4つの手法について解説します。これら4つの手法は、手作業による言語学的分析から、最新のAI技術に合わせて開発された高度なAI検出ソフトウェアの活用まで多岐にわたります。

1. 文の構造を分析する

文の長さや構造が均一な文章を探してみると、そのテキストがAIによって生成されたものかどうかがわかる場合があります。多くのAIモデルは、長さや構造が均一な文章を生成します。しかし、人間が書く文章のほとんどには「バースト性」が見られます。つまり、短く力強い文と、長く複雑な文が混在しているのです。もし文章が均一すぎる場合は、AIによる生成の可能性が高いでしょう。

人間のライターとは異なり、AIが文法ミスやタイプミスを犯すことはほとんどありません。そのため、AIによる文章を見分ける最良の方法の一つは、文法的には完璧な文章でありながら、単調だったり、過度に堅苦しかったりするかどうかを確認することです。こうした特徴が見られる場合、そのコンテンツはAIによって生成されたものである可能性が高いと言えます。

多くのAIによる文章生成パターンでは、情報を伝えるのに必要な分量よりもはるかに多くの単語が詰め込まれた文章が生成されます。例えば、1語で済むところを3語も使うといった具合です。文章を埋めるだけの余計な単語が大量に使われているにもかかわらず、特定の論点を掘り下げていない文章を読んだ場合、その文章はAIによって生成されたものである可能性があります。

2. 「AI特有の表現」(語彙の手がかり)を見つけよう

テキストがAIによって生成されたものかどうかを見分けるには、「AI特有の表現」に注目するとよいでしょう。大規模言語モデルは、役に立ち、礼儀正しい応答ができるよう訓練されています。この訓練の結果、これらのモデルによって生成された文章では、訓練データによく登場する特定の接続詞や空虚な形容詞が過剰に使用されることが珍しくありません。

AI生成のテキストかどうかを確認するには、次のようなAI特有の表現を探してみるとよいでしょう:

  • アンダースコア。
  • 深く掘り下げる。
  • タペストリー。
  • 極めて重要な。
  • ハーネス。
  • 照らす
  • 遺言。
  • 風景。
  • まとめると。

ある文章にこれらの表現が頻繁に登場する場合、その文章はAIによって生成された可能性がある。

AIモデルは親切で礼儀正しいだけでなく、デフォルトで中立的かつ過度に穏健な口調になりがちです。「留意すべき点として」や「一方で」といった表現は、明確な立場を避けるために頻繁に使われます。こうした表現にも注意を払ってください。こうした表現に依存した文章は、AIによって生成されたものである可能性があります。

3. ツールを活用してAIを正確に検出する

テキストがAIによって生成されたものかどうかを見分ける最も確実な方法は、Pangramのような専用のAI検出ツールを使用することです。直感も有用ですが、それはあくまで主観的なものです。Pangramのようなツールは客観的です。

Pangramは、人間の目には見えない統計的なパターンを特定します。これらのパターンを特定することで、PangramはコンテンツがAIによって生成されたものかどうかを判断することができます。

利用可能なAI検出ツールは数多く存在します。しかし、その多くは、文章がAIによって生成されたものかどうかを判断するために「パープレキシティ」(テキストの予測可能性)を基準としているため、あまり効果的ではありません。その結果、『独立宣言』のような作品でさえ、AI生成と判定されてしまう事態が生じています。

PangramのようなAI検出ツールは、ChatGPT特有の不自然さやその他の兆候を探すのではなく、ディープラーニングを用いて特定の構文パターンを検出します。これにより、その文章がAIによって生成されたものかどうかを正確に判断することが可能になります。

現在、最高水準のAI文章検出ツールの精度は99.98%に達し、誤検知率はほぼゼロとなっています。Pangramもその一つです。一方、無料のAI検出ツールは信頼性が低く、誤検知が起こりやすい傾向があります。

4. 「支援された」と「生成された」のニュアンスの違いを理解する

テキストがAIによって生成されたものかどうかを見分けるには、「AI支援コンテンツ」と「AI生成コンテンツ」を区別するとよいでしょう。というのも、「これはAIが書いたものか?」という問いは、必ずしも白黒はっきりしているわけではないからです。例えば、コンテンツの核となるアイデアを人が書き、その後AIを使ってそのコンテンツを編集する場合もあるからです。

Pangramなどの高度な分析ツールを使用すれば、文章の核心となるアイデアを人間が書き、AIで編集したのか、それともテキスト全体が機械によって生成されたものなのかを判別することができます。

AIによる文章作成には、さまざまな形態があります:

  • 「完全なAI生成文章」とは、AIによって完全に生成された文章を指します。これには、核心となるアイデア、文章の構成、内容、およびその文章に含まれるその他のあらゆる要素が含まれます。
  • AIを活用した執筆とは、最初に人間が書き上げた文章を、その後AIを使って推敲・修正したものを指します。

AIセグメント分析を試してみましょう:

ニュースレターを購読する
AI検出研究に関する月次更新情報を共有しています。