立即识别 Twitter、LinkedIn、Substack 等平台上的真人与 AI 内容。快来获取我们的全新 Chrome 扩展程序。

了解更多
案例研究

目前,亚马逊首页评论中有3%是由人工智能生成的

2026年5月4日

人工智能生成的内容已成为常态,从学术期刊到新闻头条,再到学术论文,随处可见。如今,人工智能也开始影响我们的购物习惯。

亚马逊是首家推出客户评论功能的在线零售商,但该系统可能正遭到ChatGPT、Claude和Gemini等大型语言模型(LLMs)的操纵。根据美国联邦法律,发布由人工智能生成的评论属于违法行为。

亚马逊表示,该公司正在使用先进的工具来标记可疑的评论记录,并在顾客看到这些评论之前将其移除。

我们的研究

我们的研究表明,亚马逊仍有改进的空间。

在 Pangram,我们想了解亚马逊上有多少条评论是由人工智能生成的,以及与人工撰写的评论相比,这些评论更倾向于正面还是负面。

为此,我们收集了亚马逊500款畅销产品首页上的30,000条产品评论,并使用我们的AI检测器对其进行了分析。我们考察了十个畅销产品类别,包括婴幼儿用品、玩具和游戏、笔记本电脑、医疗设备、健康与休闲、美妆以及家具。我们记录了每条评论的星级评分,以及该评论是否为“已验证购买”。

我们在亚马逊畅销书榜单中发现了大量人工智能生成的评论

我们发现,在所研究的全部评论中,有3%(共计909条)极有可能是由人工智能生成的。随着ChatGPT Agent等人工智能工具的普及,内容农场能够大规模自动生成人工智能评论。除非平台采取行动,否则很快我们将难以相信互联网上的任何评论。

人工智能撰写的五星好评比人类更多

在我们分析的500款亚马逊畅销商品中,74%由AI撰写的评论给出了5星评价。相比之下,真实的人类评论中这一比例为59%。反之亦然:人类撰写的1星评论比AI撰写的更多,比例分别为10%和22%。

那么“已验证购买”的评论呢?

“已验证购买”标识通常被顾客视为可靠的信任标志:它表明评论者确实购买过该产品。我们的研究发现,搜索结果首页中93%的AI生成的评论都带有“已验证购买”标识,这表明仅凭这一标识已不再是可靠的信任标志。

如果一条评论是由人工智能撰写的,它的可信度有多高?

有些评论很可能是卖家利用大型语言模型(LLM)模拟用户反馈,以此提升产品评分。还有些评论则可能出自善意的顾客之手——他们要么没有时间亲自撰写,要么难以用言语表达对产品的看法。

这并不重要,因为最终呈现的产品形象可能并不准确。

如果由人工智能撰写的评论正在推高产品评分,这可能会直接影响消费者的购买决策。

值得肯定的是,亚马逊一直在努力解决由人工智能生成的评论问题,但根据该研究的发现,他们的努力收效甚微。

大量由人工智能生成的评论未能被筛查出来,这表明亚马逊仍有改进的空间。

人工智能生成的评论会动摇消费者的信任,而当在线评论是我们决定购买产品时最主要的参考依据之一时,我们可能会开始怀疑这笔购买是否物有所值。

如何识别由人工智能生成的评论

阅读评论时,请留意其中是否提及具体的产品细节。笼统的评论或“空洞”的措辞,往往是评论由人工智能生成的迹象。

如果您打算撰写评论,请务必抵制使用ChatGPT或其他大型语言模型(LLM)的冲动。您的真实体验和看法至关重要,能够帮助他人做出明智的购买决策。

您还可以使用 Pangram 的AI 检测工具来验证您正在查看的评论是否真实。我们的Chrome 扩展程序允许您选择互联网上的任意文本,以检查其中是否包含 AI 生成的内容。

结论

尽管人工智能生成的评论属于违法行为,但它们仍不断钻空子,误导消费者。就连亚马逊自身也无法拦截所有此类评论!

企业有责任确保客户获得的是关于产品的真实信息,而非ChatGPT的观点,因此必须采取更多措施,防止此类内容出现在电子商务网站上。


马克斯·斯佩罗
马克斯·斯佩罗首席执行官、联合创始人

马克斯是一位经验丰富的机器学习工程师。他最近在Nuro公司从事自动驾驶汽车项目,负责领导主动学习方向的工作。他曾在谷歌、Two Sigma和Yelp等公司成功部署过多款机器学习产品,拥有丰富的行业经验。

马克斯拥有斯坦福大学理论计算机科学学士学位和人工智能硕士学位。除了对构建的热忱,他还是《万智牌》卡池社区的活跃成员。

查看 Max Spero 的更多内容

相关阅读

67%的网络内容消费者发现其中存在由人工智能生成的误导性信息
案例研究

67%的网络内容消费者发现其中存在由人工智能生成的误导性信息

2026年5月15日
每天有60,000篇由人工智能生成的新闻文章被发布。
案例研究

每天有60,000篇由人工智能生成的新闻文章被发布。

2024年8月5日
哪款AI检测工具最准确?30款工具测评(2026年)
案例研究

哪款AI检测工具最准确?30款工具测评(2026年)

2026年1月7日
Pangram预测21%的ICLR评审由人工智能生成
案例研究

Pangram预测21%的ICLR评审由人工智能生成

2025年11月18日
人工智能会议论文正越来越多地由人工智能撰写:自2023年以来增长了370%
案例研究

人工智能会议论文正越来越多地由人工智能撰写:自2023年以来增长了370%

2024年9月30日
Quora如何运用全字母句处理AI生成的答案
案例研究

Quora如何运用全字母句处理AI生成的答案

2024年9月26日