这是AI写的吗?4种方法判断文本是否由AI生成

亚历克斯·罗伊特曼
2026年3月12日

最近,我们几乎都读过一些读起来机械僵硬、缺乏灵魂或显得虚假的文章,这让我们不禁产生疑问:这难道是人工智能写的?随着ChatGPT等人工智能工具日益普及,人类写作与机器写作之间的界限将变得越来越模糊。

即使你“直觉”认为某篇作品是由人工智能生成的,学术诚信和/或招聘决策也可能因此受到影响。你认为某篇作品由人工智能生成的直觉可能有误,如果真是这样,有人可能会因此受到伤害。

我们将介绍四种经过验证的方法,用于判断某段文本是否由人工智能生成。这四种方法涵盖了从人工语言分析到使用针对当今人工智能技术量身定制的高级AI检测软件等多种手段。

1. 分析句子结构

通过观察句子长度与结构是否一致,可以判断一段文本是否由人工智能生成。许多人工智能模型生成的句子往往具有长度与结构一致的特点。但大多数人类写作都具有“突发性”特征:即短小精悍的句子与长而复杂的句子交替出现。如果一段文本过于千篇一律,那很可能是人工智能生成的。

与人类作家不同,人工智能很少出现语法错误或拼写错误。正因如此,识别人工智能生成内容的最佳方法之一,就是观察文本中的句子是否语法完美无缺,却显得单调乏味或过于正式。这通常表明该内容是由人工智能生成的。

许多人工智能写作的模式都表现为:句子中的词汇量远超传达信息所需的必要程度。例如,明明一个词就足够表达,却硬要用三个词来描述。如果你读到一篇充斥着大量冗余词汇的文章——这些词汇只是用来充实句子,却未能对特定观点进行深入阐述——那么这篇文章很可能是人工智能生成的。

2. 识别“AI用语”(词汇特征)

你可以通过识别“AI用语”来判断一段文字是否由AI生成。大型语言模型在训练过程中被教导要乐于助人且彬彬有礼。正因如此,这些模型生成的书面内容中,经常过度使用训练数据中常见的特定连接词和空洞的形容词,这种情况并不罕见。

要检测AI生成的文本,你可以留意以下这些AI常用短语

  • 下划线。
  • 深入探索。
  • 挂毯。
  • 至关重要。
  • 马具。
  • 点亮
  • 遗嘱。
  • 风景。
  • 综上所述。

如果某篇文章中大量出现以下任何一种短语,那么它很可能是由人工智能生成的。

除了乐于助人且彬彬有礼外,AI模型通常会默认采用一种中立且过于圆滑的语气。为了避免采取强硬立场,诸如“需要注意的是”和“另一方面”之类的短语经常出现。请多留意这些短语。过度依赖这些短语的文本很可能是AI生成的。

3. 使用工具准确检测 AI

判断文本是否由人工智能生成的最可靠方法,是使用像Pangram这样的专用AI检测工具。尽管直觉很有用,但它也是主观的。而像Pangram这样的工具则是客观的。

Pangram 能够识别肉眼无法察觉的统计规律。通过识别这些规律,Pangram 可以判断某段内容是否由人工智能生成。

目前市面上有许多不同的人工智能检测工具。然而,其中许多工具的效果并不理想,因为它们是通过检测“困惑度”(即文本的可预测性)来判断一篇作品是否由人工智能生成。这导致了诸如《独立宣言》等作品也被标记为人工智能生成。

与寻找语义模糊或其他ChatGPT特征不同,像Pangram这样的AI检测工具利用深度学习来识别特定的语法模式。这使它们能够准确判断一段文字是否由AI生成。

目前最优秀的人工智能写作检测工具准确率已达99.98%,误报率接近于零。Pangram便是其中之一。相比之下,免费的人工智能检测工具往往不可靠,且容易出现误报。

4. 区分“辅助生成”与“自主生成”的细微差别

您可以通过区分“AI辅助内容”和“AI生成内容”来判断一段文本是否由AI生成。这是因为“这是AI写的吗?”这个问题并不总是非黑即白的。例如,某人可以先撰写构成某篇内容的核心观点,然后使用AI对该内容进行编辑。

您可以使用Pangram等高级分析工具,来判断一篇文章的核心观点是否由人类撰写并借助AI进行润色,还是全文完全由机器生成。

AI写作存在于一个连续体中:

  • 完全由人工智能生成的文本是指完全由人工智能生成的文字;这包括核心思想、文章结构、内容以及文章所涵盖的其他一切内容。
  • 人工智能辅助写作是指由人起草初稿,随后借助人工智能进行润色的写作方式。

尝试进行 AI 细分市场分析:

订阅我们的电子报
我们每月分享人工智能检测研究的最新进展。