新闻

介绍 Open Pangram

2026年3月24日

🤗 模型与数据集

源代码

我们非常自豪且激动地向大家介绍两款基于我们2026年ICLR论文中提出的EditLens技术开发的Pangram模型。这两款轻量级模型在CC BY-NC-SA 4.0许可下可供非商业用途使用，且可在MacBook上运行。

我们为什么要发布 Pangram 的开源版本？

我们一直致力于人工智能检测技术的发展，并希望帮助其他研究人员在此领域取得进展。此前，我们曾通过发布《EditLens》论文向学术界做出贡献，该论文展示了分析和分类AI生成内容的新方法；我们还对同行评审和美国报纸进行了大规模分析，并为研究人员提供了API资助。通过发布EditLens模型检查点、训练数据集和源代码，我们希望研究人员能够在此基础上继续开展研究。

编辑镜头与 AI 辅助检测

随着生成式人工智能应用的发展，AI检测技术也必须随之演进。OpenAI最近的一项研究发现，ChatGPT收到的所有与写作相关的请求中，有三分之二涉及修改用户提供的文本，而非从头开始生成文本。鉴于人类与AI共同创作文本这一新兴范式，我们开发了一种创新的检测框架，用于评估AI对文本的贡献程度。Pangram用户可能已经注意到，我们的模型会返回诸如“轻度AI辅助”或“中度AI辅助”等结果。这些分类得益于我们在ICLR 2026研究论文《EditLens：量化文本中AI编辑的程度》中提出的技术。该论文介绍了一种AI检测模型，其返回的分数范围为0到1，其中0表示完全由人类撰写的文本，1表示完全由AI生成的文本。随着数据集和源代码的发布，现在任何人都可以训练自己的EditLens模型。

数据集

我们发布了EditLens数据集，其中包含6万个训练样本、2400个验证样本和6000个测试样本。每个数据集子集均包含来自4个领域的纯人工撰写文本、纯AI生成文本以及AI编辑文本。 AI编辑文本的生成方式是：对来自以下5个领域之一的人类撰写源文本应用编辑提示：新闻（Narayan等，2018；See等，2017）、创意写作（Fan等，2018）、亚马逊评论（Zhang等，2015）、谷歌评论（Li et al., 2022）以及教育相关网络内容（Lozhkov et al., 2024）。

用于生成AI生成和AI编辑文本的模型是OpenAI的 gpt-4.1-2025-04-14 , Anthropic 的 克劳德·十四行诗-4-20250514 ，以及谷歌的gemini-2.5-flash.

EditLens 数据集还包含两个域外评估子集：来自保留源文本域（电子邮件）的 6,000 个样本，以及由 Meta 的 Llama-3.3-70B-Instruct-Turbo .

此外，我们发布了一个由我们收集的数据集，其中包含近1800篇经过Grammarly编辑的文本。该数据集由200篇人工撰写的源文本及其9种不同的编辑版本组成。每种编辑（例如“简化此句”）均来自Grammarly原生文字处理器的编辑建议。这200篇人工撰写的源文本分别采样自Persuade 2.0（Crossley等人，2024）、ELLIPSE（Crossley等人，2023）、BAWE（Nesi等人，2004）、 ICNALE（Ishikawa等人，2007）、CLASSE（Crossley等人，2024）或PIILO（Holmes等人，2023）数据集之一中抽取的。

您可以在HuggingFace 上探索这两个数据集。

模型

pangram/editlens_Llama-3.2-3B简体中文（大陆） 该模型使用 QLoRA 进行了微调，最大序列长度为 1024 个令牌。基础模型拥有 30 亿个参数。

pangram/editlens_roberta-large该模型拥有3.55亿个参数，在最大序列长度为512个令牌的条件下进行了微调。

这两个模型均按照EditLens论文中描述的方法进行了1个 epoch的训练。这两个模型的更多超参数和训练代码可在EditLens的GitHub仓库中找到。您可以从HuggingFace下载模型检查点。

评价

对于二分类和三分类，我们通过在保留的验证集上进行校准来确定阈值。

在二元评估中，我们确定了能够最大化F1分数的阈值，用于区分完全由人类撰写和完全由AI生成的文本。二元评估中不包含任何由AI编辑过的文本。

对于三元评估，我们确定了两个阈值。首先，我们将评估数据分为三类：人工、AI 和 AI 编辑。然后，我们确定一个下阈值，用于将人工类与 [AI, AI 编辑] 数据的并集区分开来；同时确定一个上阈值，用于将 AI 类与 [人工, AI 编辑] 数据的并集区分开来。这两个阈值均通过最大化 F1 分数来确定。

域内测试集

二元分类结果

2,038篇人类文本和2,046篇AI文本

探测器	宏 F1	FPR	FNR
Pangram 3.2（当前量产型号）	1.000	0.000	0.000
Pangram OSS：editlens_Llama-3.2-3B	1.000	0.000	0.000
Pangram OSS：editlens_roberta-large	0.997	0.002	0.003
Fast-DetectGPT	0.895	0.121	0.088
双筒望远镜	0.886	0.128	0.101

三元分类结果

2,038篇人类撰写的文本、2,046篇AI生成的文本以及2,031篇经AI编辑的文本

探测器	准确性	宏 F1	人类 F1	AI F1	AI编辑的F1
Pangram 3.2（当前量产型号）	0.920	0.920	0.926	0.957	0.876
Pangram OSS：editlens_Llama-3.2-3B	0.895	0.895	0.895	0.948	0.842
Pangram OSS：editlens_roberta-large	0.881	0.881	0.900	0.923	0.819
Fast-DetectGPT	0.585	0.545	0.246	0.831	0.558
双筒望远镜	0.569	0.523	0.213	0.811	0.545

保留域名（安然公司电子邮件）

二元分类结果

1,992篇人类文本和1,847篇AI文本

探测器	宏 F1	FPR	FNR
Pangram 3.2（当前量产型号）	0.999	0.001	0.001
Pangram OSS：editlens_Llama-3.2-3B	0.998	0.001	0.004
Pangram OSS：editlens_roberta-large	0.966	0.001	0.068
Fast-DetectGPT	0.941	0.079	0.036
双筒望远镜	0.914	0.155	0.011

三元分类结果

1,992篇人类撰写的文本、1,847篇AI生成的文本以及2,308篇经AI编辑的文本

探测器	准确性	宏 F1	人类 F1	AI F1	AI编辑的F1
Pangram 3.2（当前量产型号）	0.905	0.909	0.898	0.956	0.872
Pangram OSS：editlens_Llama-3.2-3B	0.863	0.868	0.855	0.936	0.812
Pangram OSS：editlens_roberta-large	0.695	0.673	0.847	0.515	0.657
Fast-DetectGPT	0.625	0.589	0.261	0.886	0.619
双筒望远镜	0.618	0.575	0.266	0.857	0.601

保留的模型（Llama 3.3 70B Instruct）

二元分类结果

2,038篇人类文本和2,038篇AI文本

探测器	宏 F1	FPR	FNR
Pangram 3.2（当前量产型号）	1.000	0.000	0.000
Pangram OSS：editlens_Llama-3.2-3B	1.000	0.000	0.000
Pangram OSS：editlens_roberta-large	0.987	0.002	0.025
Fast-DetectGPT	0.939	0.121	0.000
双筒望远镜	0.936	0.128	0.000

三元分类结果

2,038篇人类撰写的文本、2,038篇AI生成的文本以及1,881篇经AI编辑的文本

探测器	准确性	宏 F1	人类 F1	AI F1	AI编辑的F1
Pangram 3.2（当前量产型号）	0.952	0.951	0.946	0.985	0.923
Pangram OSS：editlens_Llama-3.2-3B	0.921	0.920	0.918	0.965	0.877
Pangram OSS：editlens_roberta-large	0.860	0.859	0.908	0.879	0.791
Fast-DetectGPT	0.562	0.506	0.262	0.817	0.440
双筒望远镜	0.540	0.478	0.227	0.796	0.411

第三方基准测试

非英语母语者（Liang 等，2023）

91篇人类撰写的文本

探测器	FPR
Pangram 3.2（当前量产型号）	0.000
Pangram OSS：editlens_Llama-3.2-3B	0.055
Pangram OSS：editlens_roberta-large	0.099
双筒望远镜	0.560
Fast-DetectGPT	0.670

人体检测器（Russell 等，2024）

150篇人类撰写的文本和150篇AI生成的文本

探测器	宏 F1	FPR	FNR
Pangram 3.2（当前量产型号）	1.000	0.000	0.000
Pangram OSS：editlens_Llama-3.2-3B	0.987	0.027	0.000
Pangram OSS：editlens_roberta-large	0.960	0.020	0.060
双筒望远镜	0.846	0.087	0.220
Fast-DetectGPT	0.735	0.487	0.013

RAID，随机抽取的10,000个样本（Dugan等人，2024）

2,058篇人类文本和7,942篇AI生成的文本

Detectorc	宏 F1	FPR	FNR
Pangram 3.2（当前量产型号）	0.992	0.002	0.007
Fast-DetectGPT	0.941	0.078	0.028
双筒望远镜	0.939	0.100	0.024
Pangram OSS：editlens_Llama-3.2-3B	0.930	0.003	0.062
Pangram OSS：editlens_roberta-large	0.736	0.007	0.288

Grammarly 数据集

在这些箱线图中，我们展示了我们收集的Grammarly数据集上的评分分布情况，并按所应用的修改类型进行了分组。值得注意的是，EditLens对“修正任何错误”这类仅涉及语法和拼写的小幅修正的修改，赋予了非常低的、接近人类评分的评分；而对于“使其更详细”这类更具“增补性”的修改，则赋予了更高的评分。

Pangram OSS 模型按编辑指令划分的分数分布：editlens_Llama-3.2-3B

Pangram OSS 不同编辑指令下的分数分布：editlens_roberta-large

Open Pangram 应该用于什么？

我们鼓励研究人员在人工智能检测研究中将 Open Pangram 模型作为基准。我们希望这些数据集和源代码能帮助研究人员进一步拓展我们的工作。

Open Pangram 不应用于哪些用途？

禁止将 Open Pangram 用于商业用途。在教育或专业环境中，请勿使用 Open Pangram 模型来执行任何形式的人工智能使用政策。如需获取误报率处于行业领先水平的更精准模型，请联系我们了解企业级服务或申请研究 API 资助。

凯瑟琳·泰

凯瑟琳·泰创始人工智能研究科学家

凯瑟琳·泰（Katherine Thai）是人工智能检测初创公司Pangram Labs的创始人工智能研究科学家。她于2025年12月在马萨诸塞大学阿默斯特分校获得计算机科学博士学位，导师为莫希特·伊耶（Mohit Iyyer），其研究主要致力于评估大型语言模型（LLMs）在文学分析相关任务中的表现。

更多来自凯瑟琳·泰的内容

相关阅读

关于拜登人工智能安全行政令的声明

关于拜登人工智能安全行政令的声明

今天，拜登政府发布了关于人工智能安全与保障的新标准，其中包括一项关于人工智能内容检测的指令。

马克斯·斯佩罗2023年10月31日

EditLens 入选 ICLR 2026

EditLens 入选 ICLR 2026

我们最新的技术论文《EditLens》已被ICLR录用，该会议是机器学习领域最负盛名的学术会议之一。

布拉德利·埃米2026年1月29日

解读欧盟新《人工智能法》

解读欧盟新《人工智能法》

上周，欧洲议会通过了《人工智能法案》（AI Act），该法案为欧盟成员国监管人工智能产品和服务提供了全面的框架。

阿尚·马拉2024年3月23日

为什么全字母句要有最低字数要求？

为什么全字母句要有最低字数要求？

您可能最近已经注意到，Pangram 的 AI 检测器在判断是 AI 还是人类生成时，设定了最低字数要求。这是为什么呢？

埃利亚斯·马斯鲁尔2025年5月23日

AI 检测技术有了重大突破：隆重推出 Checkfor.ai

AI 检测技术有了重大突破：隆重推出 Checkfor.ai

今天，我们正式推出 Checkfor.ai——一款只需简单复制粘贴即可检测AI生成内容的工具。

马克斯·斯佩罗和布拉德利·埃米2023年10月12日

学生如何试图规避AI检测

学生如何试图规避AI检测

学生可能会修改AI生成的文章，试图蒙骗AI检测工具，具体做法包括引入语法和标点错误、删除某些词语和短语，以及改写整个句子和段落。

利维·戈德斯坦2025年10月24日

订阅
以获取我们的最新动态

随时掌握我们的最新资讯与优惠活动。

soc2

SOC2 第2类

经AssuranceLab验证

© 2025 Pangram。保留所有权利。

info@pangram.com

加入我们的社区

© 2025 Pangram。保留所有权利。