立即识别 Twitter、LinkedIn、Substack 等平台上的真人与 AI 内容。快来获取我们的全新 Chrome 扩展程序。

了解更多
新闻

为什么全字母句有最低字数要求?

2025年5月23日

Pangram的文本模型是市场上最精准的人工智能检测器。但我们需要至少50个单词才能给出预测结果。这是为什么呢?

以"delve"这个词为例。数据集统计显示,AI写作中使用"delve"的频率几乎是人类写作的15倍。但单看这个词本身,任何人都可能写出"delve"。我——一个真人(保证)——刚刚就写了:delve!

Pangram模型能够理解这种差异。事实上,它不仅关注特定文本中的哪些词汇,更着重于词汇使用的语境。

原理说明

例如,我刚刚写了包含单词"delve"的这句话,但Pangram却将其标记为human:

我其实超级期待读《了不起的盖茨比》!听说这是美国史上最受欢迎的小说之一,正因如此,我对深入阅读这部作品充满兴趣。我的父母、老师和朋友都对它赞不绝口,而我非常信任他们的判断!

检测到全字母句的人类检测到全字母句的人类

Pangram表示,它对文本为人工撰写一事深信不疑。

接下来,我让ChatGPT写几句关于它为何期待阅读《了不起的盖茨比》的文字(并包含"深入探索"这个词)。以下是它的回答:

我迫不及待想阅读《了不起的盖茨比》,因为它让我得以深入探索狂野二十年代的浮华与幻灭。我好奇菲茨杰拉德如何通过这些标志性人物刻画野心、爱情与美国梦。尤其令我心驰神往的是体验书中如诗般的文字,并揭开盖茨比神秘人生背后的深层含义。

全字母句检测AI全字母句检测AI

在此,Pangram表示其高度确信该文本由人工智能生成。

当然,这些文本之间存在诸多差异,而庞格拉姆模型正是通过这些差异来判断文本是人工智能还是人类所写。这两个样本都使用了人工智能常用词"delve",但该词的使用语境——即何时使用以及如何使用——至关重要。如果庞格拉姆模型只能看到"delve"周围的几个词,我们便无法分辨。你能分辨吗?

“深入探索的机会”

“深入探讨这个问题的机会”

我们对此采取什么行动

由于需要上下文,Pangram强制要求最低50个单词的长度。这确保模型拥有足够的上下文信息,从而生成值得信赖的预测结果。

想了解更多关于我们的模型、准确性和性能的信息?请访问此页面!


埃利亚斯·马斯鲁尔

Elyas Masrour 是 Pangram 的创始工程师。自马里兰大学毕业后,他作为 Pangram 的第二名员工加入公司,此后构建了多项关键基础设施,包括模型服务 API、基于角色的访问控制以及支持性证据处理管道。Elyas 还与研究团队紧密合作,共同开展对抗性鲁棒性、模型可解释性以及异构混合内容检测等项目。 工作之余,埃利亚斯热衷于探索人类创造力和表达的方方面面,包括电影制作、阅读以及城市探索。

查看Elyas Masrour的更多内容