宣布与Proofig建立全新合作伙伴关系!了解更多

是的,AI检测可以很准确。

亚历克斯·罗伊特曼
2025年9月16日

简而言之:学术界 与内容审核人员应重新评估对AI检测工具的判断。2023年学术论文与大众媒体形成的共识已过时。最新AI检测模型(如Pangram)不仅已追平最新大型语言模型(LLMs)的水平,更具备面向未来的适应能力。

我们是如何走到这一步的:人工智能检测简史


2022年ChatGPT问世时,作家和内容创作者们蜂拥而至,利用这款新型人工智能工具进行创作。此后热潮便未曾停歇。创作者们借助ChatGPT(及其他AI模型)及其竞争对手,创作内容涵盖从研究论文、小说等长篇文档到电子邮件、Reddit评论、亚马逊书评等短小片段。人工智能生成的内容迅速充斥整个互联网。 然而自大型语言模型诞生以来,区分人写与AI写的需求始终存在。OpenAI敏锐捕捉到这一需求,开发出能识别AI文本的产品。随着AI应用普及,AI检测器或分类器的需求激增,尤其在学术诚信至关重要的高校领域。部分学生(通常是早期使用者)利用最新模型完成作业、应试甚至申请大学。 部分研究人员在时间压力下偷工减料,提交由AI撰写或辅助完成的论文。为此,众多工具应运而生以解决这些问题。学术软件巨头TurnItIn于2023年4月推出AIChecker工具,服务现有教育客户;Grammarly也在2024年推出自主研发的GrammarlyAuthorship工具。 这些公司的核心理念是:既然能识别抄袭,就应能识别AI。高等教育领域尤其需要从"抄袭检测器"向"AI检测器"转型。然而很早便显现出这种思路行不通。

早期的人工智能检测器通过使用困惑度和突发性来保证准确性。Pangram的首席技术官布拉德利·埃米解释了这些术语:"困惑度是指文本中每个单词的意外性或惊喜程度。突发性则是困惑度在文档中的变化趋势。如果文档中穿插着一些出人意料的词语和短语,那么它就具有较高的突发性。"

我们不会纠缠于这些术语,但在创建AI检测工具时过度依赖这些因素,会导致三种常见缺陷:

这些担忧对学术机构而言尤为切身。错误指控学生和研究人员在学术研究及论文中使用人工智能的后果极其严重,足以毁掉职业生涯。即便有效率高达95%的工具,若用于筛查人工智能生成内容也风险极高。 因此,麻省理工学院范德堡 大学和加州大学伯克利分校等顶尖学府均不支持教师使用AI检测工具。这些机构常援引具体研究论文(如《AI生成文本检测工具测试》)及行业文章(如《为何AI写作检测器失效》),详细阐述了AI检测工具的低效表现。

OpenAI发现这些问题如此棘手,以至于他们在2023年7月放弃了其AI文本分类器,称"由于准确率过低,该AI分类器已停止提供服务"。许多学校管理者由此得出结论:如果OpenAI都做不到,那这件事大概率是不可能的。

尽管顶尖大学和公众普遍认为人工智能检测的承诺难以实现甚至纯属虚妄,但像Pangram Labs这样的公司却在该领域取得了重大突破,使人工智能检测成为大学和企业环境中的关键工具。

为何2025年的人工智能检测与众不同

AI检测常被比作一场军备竞赛——学生们寻找捷径,教育者则试图筛选出人写与非人写的内容。2025年,检测器们加码了赌注。

2025年8月,芝加哥大学布斯商学院的两位研究员布莱恩·贾巴里安与亚历克斯·埃米发表了一篇题为 《人工智能写作与自动检测》指出"多数商用AI检测器表现卓越,其中Pangram的假阳性率与假阴性率均趋近于零"。他们特别强调Pangram是"唯一在严格政策限制下(假阳性率≤0.005)仍能精准识别AI文本的检测器"。 这充分展现了短短数年间AI检测技术取得的飞跃性进展。但这一突破究竟是如何实现的?

首先,人工智能研究人员通过收集更广泛的人类文本和人工智能生成的文本来改进数据集。这不仅包括学术论文,还涵盖电子邮件、文章等其他类型的写作。其次,开发者运用主动学习技术来降低误报率。这意味着他们主动寻找最难区分是人工智能还是人类创作的文本,然后将其重新整合回模型中。

在这场军备竞赛中,通用人工智能的开发者尚未采取足够措施来突破某些AI检测器。当OpenAI备受瞩目的GPT-5发布时,其宣称能减少幻觉现象、增强语感并提升创作能力。 然而12小时内,Pangram Labs联合创始人马克斯·斯佩罗便在领英发文指出:无需额外训练,Pangram的AI检测工具对GPT-5测试的识别率与旧版模型持平:

Pangram 是唯一无需专门训练即可可靠检测 GPT-5 的 AI 检测器。

机构正在迎头赶上新的现实

关于人工智能检测器的使用,确实存在诸多担忧。许多检测器仍存在令人担忧的误报率,且其准确性宣传存在虚假成分。然而,部分最新技术已展现出极高的可靠性,正积极应用于企业与高校领域。例如,专家引荐公司Qwoted近期将其工作流程与人工智能检测技术整合,以减少"专家"提供的AI生成引文。"新闻业的未来取决于信任。正因如此,我们很高兴能与Pangram合作——该公司在人工智能检测与归因领域树立了黄金标准。"

研究人员和记者也正重新加入阵营。 长期批评者正在改变先验观点,探索将AI检测纳入更广泛AI政策的方法。《新闻公报》的罗布·沃近期向用户推荐了Pangram这款识别AI生成文本的工具:"此类工具虽非百分百可靠,但Pangram在众多在线AI检测器中被评为准确率较高,并已集成至记者响应服务平台Qwoted中,用于识别AI生成的提案和文案。"

我们期待与您探讨具体应用场景,并评估Pangram能否为贵机构创造价值。欢迎试用我们的服务,并垂询企业级解决方案。

订阅我们的电子报
我们每月分享人工智能检测研究的最新进展。
订阅
以获取我们的最新动态
随时掌握我们的最新资讯与优惠活动。
© 2025 Pangram。保留所有权利。