最近,我们几乎都读过一些读起来机械僵硬、缺乏灵魂或显得虚假的文章,这让我们不禁产生疑问:这难道是人工智能写的?随着ChatGPT等人工智能工具日益普及,人类写作与机器写作之间的界限将变得越来越模糊。
即使你“直觉”认为某篇作品是由人工智能生成的,学术诚信和/或招聘决定也可能因此受到影响。你认为某篇作品由人工智能生成的直觉可能有误,如果真是这样,有人可能会因此受到伤害
我们将介绍四种经过验证的方法,用于判断某段文本是否由人工智能生成。这四种方法涵盖了从人工语言分析到使用针对当今人工智能技术量身定制的高级AI检测软件等多种手段。
通过观察句子长度和结构是否一致,可以判断一段文本是否由人工智能生成。许多人工智能模型生成的句子往往具有长度和结构的一致性。但大多数人类写作都具有“突发性”特征:即短小精悍的句子与长而复杂的句子交替出现。如果一段文本过于千篇一律,那很可能是人工智能生成的。
与人类作家不同,人工智能很少出现语法错误或拼写错误。正因如此,识别人工智能生成内容的最佳方法之一,就是观察文本中的句子是否语法完美无缺,但读起来却显得单调或过于正式。这通常表明该内容是由人工智能生成的。
许多人工智能写作的特征在于,句子中包含的词汇远多于传达信息所需的数量。例如,明明一个词就足够表达的意思,却用了三个词。如果你读到一篇充斥着大量冗余词汇的文章——这些词汇只是用来充实句子,却未能对特定观点进行展开——那么这篇文章很可能是人工智能生成的。
你可以通过识别“AI用语”来判断一段文字是否由AI生成。大型语言模型在训练过程中被要求做到乐于助人且彬彬有礼。正因如此,这些模型生成的书面内容中,经常过度使用训练数据中常见的特定连接词和空洞的形容词,这种情况并不罕见。
要检测AI生成的文本,您可以留意以下这些AI特有的短语:
如果某篇文章中大量出现以下任何一种短语,那么它很可能是由人工智能生成的。
除了乐于助人且彬彬有礼外,AI模型通常会默认采用一种中立且过于圆滑的语气。为了避免采取强硬立场,诸如“需要注意的是”和“另一方面”之类的短语经常出现。请多留意这些短语。过度依赖这些短语的文本很可能是AI生成的。
判断文本是否由人工智能生成的最可靠方法,是使用像Pangram这样的专用AI检测工具。尽管直觉很有用,但它也是主观的。而像Pangram这样的工具则是客观的。
Pangram 能够识别肉眼无法察觉的统计规律。通过识别这些规律,Pangram 可以判断某篇内容是否由人工智能生成。
目前市面上有许多不同的人工智能检测工具。然而,其中许多工具的效果并不理想,因为它们通过检测“困惑度”(即文本的可预测性)来判断一篇作品是否由人工智能生成。这导致了诸如《独立宣言》等作品也被标记为人工智能生成。
与寻找语义模糊或其他ChatGPT特征不同,像Pangram这样的AI检测工具利用深度学习来识别特定的语法模式。这使它们能够准确判断一段文字是否由AI生成。
目前最优秀的人工智能写作检测工具准确率已达99.98%,误报率接近于零。Pangram便是其中之一。相比之下,免费的人工智能检测工具往往不可靠,且容易出现误报。
您可以通过区分“AI辅助生成”和“AI生成”的内容,来判断一段文本是否由AI生成。这是因为“这是AI写的吗?”这个问题并不总是非黑即白的。例如,有人可以先写出构成某篇内容的核心观点,然后使用AI对该内容进行编辑。
您可以使用Pangram等高级分析工具,来判断一篇作品的核心思想是由人类撰写并借助AI进行润色,还是完全由机器生成的。
AI写作存在一个连续体:

亚历克斯·罗伊特曼(Alex Roitman)是人工智能内容检测公司Pangram Labs的增长主管。他的工作重点在于研究人工智能生成的文本如何重塑写作、教育以及人们对开放网络的信任。