立即识别 Twitter、LinkedIn、Substack 等平台上的真人与 AI 内容。快来获取我们的全新 Chrome 扩展程序。

了解更多
产品更新

全字母文本AI检测器现已支持多语言!

2024年7月1日

摄影:瓦伦丁·安东努奇。摄影:瓦伦丁·安东努奇。

我们激动地宣布,旗舰AI检测模型Pangram Text迎来重大更新。该模型现已支持检测西班牙语、法语、意大利语、葡萄牙语、德语、俄语及汉语的AI生成文本,其检测准确度与英文文本检测保持同等行业领先水平。我们正立即推出全新多语言模型,为在线平台提供AI垃圾信息防护。

基准测试

为验证模型在非英语语言中的准确性,我们采用了来自不同领域的三组大型多元语言语料库:亚马逊多语言评论、维基百科以及XLSum(BBC国际新闻)。

在人类标注部分,我们从通过合理性检查过滤器的文档中随机抽样。在AI标注部分,我们混合使用GPT-3.5、GPT-4和GPT-4o模型。首先要求大型语言模型对真实文档进行摘要处理,例如"这篇评论讨论什么内容?";随后根据摘要要求其生成评论、文章或新闻稿。 通过这种方式生成基准测试数据,既消除了标签噪声的可能性,又确保了人类数据与AI数据的分布尽可能接近。

语言亚马逊评论准确性维基百科的准确性XLSum(BBC新闻)准确性
西班牙语99.59%99.75%99.75%
法语98.84%99.33%98.50%
意大利语不适用99.82%不适用
德语99.44%99.95%不适用
葡萄牙语不适用99.83%99.70%
俄罗斯不适用98.34%99.35%
中文99.70%99.54%98.10%

常见问题解答

  • 您是如何更新模型以支持这些语言的?

由于我们的模型基于与现代大型语言模型相似的架构,我们采用大规模预训练确保其骨干网络在多语言语料库上充分训练,随后再进行AI检测头部模型的微调。同时,我们使用的分词器支持包括俄语和中文在内的多种语言。

  • 你为什么选择这些特定的语言?

我们选择了代表互联网上使用语言绝大多数的语言。

  • 如果我提交了不支持的语言的文本会怎样?

我们使用Amazon Comprehend来检测输入文本的语言。如果该语言不受支持,则将返回"不受支持的语言"作为预测结果。

  • 该模型会随着时间推移而改进吗?

是的,随着我们通过主动学习持续扩展多语言数据集,未来版本将针对非英语语言提供性能优化。

  • 其他语言呢?

我们计划在未来支持更多语言。如果您希望看到某种语言被支持,请随时告知我们!

如需了解多语言AI检测的更多信息,请通过info@pangram.com联系我们。


布拉德利·艾米
布拉德利·埃米首席技术官,联合创始人

布拉德利是一位人工智能研究员,在工业领域构建深度学习产品方面造诣深厚。他近期曾领导生成式人工智能药物发现公司Absci的深度学习研究团队,此前还担任特斯拉自动驾驶核心计算机视觉团队成员。

在攻读研究生期间,布拉德利与斯坦福视觉实验室合作发表了多篇深度学习研究论文。他拥有斯坦福大学物理学学士学位和人工智能硕士学位。除人工智能外,他对教育学、哲学充满热情,同时还是位狂热的高尔夫球手。

查看布拉德利·埃米的更多内容

相关阅读

AI检测器对GPT-5有效吗?
产品更新

AI检测器对GPT-5有效吗?

2025年8月7日
全字母文本更新:GPT-4o、Claude 3、LLaMA 3
产品更新

全字母文本更新:GPT-4o、Claude 3、LLaMA 3

2024年5月22日
高精度AI生成文本检测技术报告
产品更新

高精度AI生成文本检测技术报告

2024年2月21日
欢迎体验 Pangram 3.3!
产品更新

欢迎体验 Pangram 3.3!

2026年5月13日
“Pangram”在GPT-5.4上能用吗?
产品更新

“Pangram”在GPT-5.4上能用吗?

2026年3月6日
宣布推出AI识别功能:Pangram能够区分不同的LLM模型
产品更新

宣布推出AI识别功能:Pangram能够区分不同的LLM模型

2025年2月11日