AI教育

「これはAIが書いたもの?」テキストが生成されたものかどうかを確認する4つの方法

最近、ほとんど誰もが、あまりにも機械的で、魂が感じられず、あるいは不自然だと感じる文章を目にしたことがあるでしょう。そして、「これ、AIが書いたんじゃないの?」と疑問に思ったはずです。ChatGPTのようなAIツールがますます普及するにつれ、人間と機械による文章の境界線はますます曖昧になっていくでしょう。

たとえ「直感」で何かがAIによって生成されたと感じたとしても、学術的誠実性や採用の可否がかかっている可能性があります。ある文章がAIによって生成されたというあなたの直感は間違っている可能性があり、もしそうであれば、その直感によって誰かが不利益を被る恐れがあります

特定のテキストがAIによって作成されたものかどうかを判断するための、実績のある4つの手法について解説します。これら4つの手法には、手作業による言語分析から、最新のAI技術に合わせて開発された高度なAI検出ソフトウェアの活用までが含まれます。

1. 文の構造を分析する

文の長さや構造が均一な文章を探してみると、そのテキストがAIによって生成されたものかどうかがわかる場合があります。多くのAIモデルは、長さや構造が均一な文章を生成します。しかし、人間が書く文章のほとんどには「バースト性」が見られます。つまり、短く力強い文章と、長く複雑な文章が混在しているのです。もし文章が均一すぎる場合は、AIによる生成の可能性が高いでしょう。

人間のライターとは異なり、AIが文法ミスやタイプミスを犯すことはほとんどありません。そのため、AIによる文章を見分ける最良の方法の一つは、文法的には完璧な文章でありながら、単調だったり過度に堅苦しかったりするかどうかを確認することです。こうした特徴が見られる場合、そのコンテンツはAIによって生成されたものである可能性が高いと言えます。

多くのAIによる文章生成パターンでは、情報を伝えるのに必要な分量よりもはるかに多くの単語が詰め込まれた文章が生成されます。例えば、1語で済むところを3語も使うといった具合です。文章を埋めるだけの余計な単語が散見され、特定の論点を掘り下げていない文章を読んだ場合、その文章はAIによって生成されたものである可能性があります。

2. 「AI特有の表現」を見つけよう(語彙から読み取る)

テキストがAIによって生成されたものかどうかは、「AI特有の表現」を見分けることで判断できます。大規模言語モデルは、役に立ち、礼儀正しい応答ができるよう訓練されています。この訓練の結果、これらのモデルによって生成された文章では、訓練データによく登場する特定の接続詞や中身のない形容詞が過剰に使われることが珍しくありません。

AI生成のテキストかどうかを確認するには、次のようなAI特有の表現を探してみるとよいでしょう:

  • アンダースコア。
  • 深く掘り下げる。
  • タペストリー。
  • 極めて重要な。
  • ハーネス。
  • 照らす
  • 遺言。
  • 風景。
  • まとめると。

文章の中にこれらの表現が頻繁に現れる場合、その文章はAIによって生成された可能性がある。

AIモデルは親切で礼儀正しいだけでなく、デフォルトで中立的で、過度に控えめな口調になりがちです。「留意すべき点として」や「一方で」といった表現は、明確な立場を避けるために頻繁に使われます。こうした表現にも注意を払ってください。こうした表現に過度に依存した文章は、AIによって生成されたものである可能性があります。

3. ツールを活用してAIを正確に検出する

テキストがAIによって生成されたものかどうかを見分ける最も確実な方法は、Pangramのような専用のAI検出ツールを使用することです。直感も役に立ちますが、それはあくまで主観的なものです。Pangramのようなツールは客観的です。

Pangramは、人間の目には見えない統計的なパターンを特定します。これらのパターンを特定することで、PangramはコンテンツがAIによって生成されたものかどうかを判断することができます。

利用可能なAI検出ツールは数多く存在します。しかし、その多くは、文章がAIによって生成されたものかどうかを判断するために「パープレキシティ」(テキストの予測可能性)を基準としているため、あまり効果的ではありません。その結果、『独立宣言』のような作品でさえ、AI生成と判定されてしまう事態が生じています。

PangramのようなAI検出ツールは、ChatGPT特有の不自然さやその他の兆候を探すのではなく、ディープラーニングを用いて特定の構文パターンを検出します。これにより、その文章がAIによって生成されたものかどうかを正確に判断することが可能になります。

現在、最高水準のAI文章検出ツールの精度は99.98%に達し、誤検知率はほぼゼロとなっています。Pangramもその一つです。一方、無料のAI検出ツールは信頼性が低く、誤検知が起こりやすい傾向があります。

4. 「支援された」と「生成された」のニュアンスの違いを理解する

テキストがAIによって生成されたものかどうかを見分けるには、「AI支援型コンテンツ」と「AI生成型コンテンツ」を区別するとよいでしょう。というのも、「これはAIが書いたものか?」という問いは、必ずしも白黒はっきりつかないからです。例えば、誰かがコンテンツの核となるアイデアを書き、その後AIを使ってそのコンテンツを編集する場合もあるからです。

Pangramなどの高度な分析ツールを使用すれば、文章の核心となるアイデアを人間が書き、AIで編集したのか、それともテキスト全体が機械によって生成されたものなのかを判別することができます。

AIによる文章作成には、さまざまな形態があります:

  • 「完全なAI生成文章」とは、AIによって完全に生成された文章を指します。これには、核心となるアイデア、文章の構成、内容、およびその文章に含まれるその他のあらゆる要素が含まれます。
  • AIを活用した執筆とは、最初に人間が書き上げた文章を、その後AIを使って推敲・修正することを指します。

AIによるセグメント分析を試してみましょう:


アレックス・ロイトマン

アレックス・ロイトマン氏は、AIコンテンツ検出企業であるパングラム・ラボ(Pangram Labs)の成長部門責任者です。彼の仕事は、AI生成テキストが、執筆活動、教育、そしてオープンウェブにおける信頼をどのように変革しているかに焦点を当てています。

アレックス・ロイトマンの他の記事

関連記事

AI検出に関する誤解と誤った認識
AI教育

AI検出に関する誤解と誤った認識

2025年2月25日
はい、AIによる検出は正確である可能性があります
AI教育

はい、AIによる検出は正確である可能性があります

2025年9月16日
AIで最も多用されるフレーズを巡る
AI教育

AIで最も多用されるフレーズを巡る

2025年2月21日
RedditでAIを見分ける方法 - ボットとの戦い
AI教育

RedditでAIを見分ける方法 - ボットとの戦い

2026年2月6日
AIによる文章のパターンを識別するための完全ガイド
AI教育

AIによる文章のパターンを識別するための完全ガイド

2025年4月2日
教師は、あるものがAIによって生成されたものかどうかをどのように見分ければよいのでしょうか?
AI教育

教師は、あるものがAIによって生成されたものかどうかをどのように見分ければよいのでしょうか?

2025年4月9日