宣布与Proofig建立全新合作伙伴关系!了解更多

让您的业务具备法律硕士(LLM)和通用人工智能(GenAI)应对能力

马克斯·斯佩罗与西奥多罗斯·埃夫根纽
2024年1月30日

毫无疑问,2023年度最具影响力的人物当属人工智能。大型语言模型(LLMs)乃至生成式人工智能(GenAI)的创新速度与能力令我们猝不及防。与此同时,许多人——尤其是在线平台从业者——开始质疑这些技术可能引发的风险,详见《哈佛商业评论》这篇阐述人工智能风险的文章。 网络平台或将很快被AI生成内容淹没,这不仅影响用户安全与留存率,更关乎平台声誉。已有初创企业推出工具,可批量生成并传播海量生成式AI内容。

但人工智能和生成式人工智能同样能为我们所用,帮助管理这些风险,创造更安全的数字空间和在线平台——正如最新一届信任与安全黑客马拉松中提出的若干构想所示。随着新工具的涌现,此刻正是审视我们所处阶段的良机:在应对生成式人工智能给在线平台带来的风险方面,我们需要评估当前创新成果与管理流程的进展。

本文可帮助解答以下问题:

  • 如何才能最有效地保护我们的业务、在线社区和用户,使其免受海量人工智能生成内容的侵害(例如从评论垃圾信息到侵犯版权及其他法律的非法内容)?
  • 人工智能生成的内容能否被识别?
  • 在人工智能生成内容的生命周期中,安全防护措施可在何时启用?又该如何实施?
  • 相关法规在不同市场如何发展,这对您意味着什么?

根据您的业务模式和需求制定生成式人工智能策略


所有涉及用户生成内容的企业都需要制定生成式人工智能政策。通常需要回答两个问题:用户是否愿意看到人工智能生成的内容?用户能否接受人工智能内容与人类内容混合呈现?

若您对上述任一问题的回答是否定的,则需要制定人工智能内容相关政策。例如要求披露人工智能内容,或明确禁止使用人工智能内容。此类政策可通过具备敏锐洞察力的人工审核员执行,配合Pangram Labs等工具建立高效流程。

如果答案是肯定的——用户对看到AI内容持接受或积极态度——那么从政策角度来看,你已符合要求。但在直接引入AI工具(如领英的AI辅助消息功能)之前,仍需确保内容的安全性。 为此,你需要建立防护机制,更重要的是始终建立高效的内容审核流程——类似于用户生成内容的审核机制,可借助Tremau等内容审核平台实现对AI生成内容的有效监管。

当然,您的生成式人工智能政策需根据业务性质和具体情境制定,不存在通用的解决方案。例如,若您运营的是依赖用户评价的市场平台,则必须确保平台上不存在任何由人工智能生成的虚假评论。 更普遍而言,您还需确保平台上不存在任何由AI生成的非法内容——这与用户生成内容的监管要求如出一辙。机器人和垃圾信息始终是行业难题,而生成式AI赋予它们更强大的破坏力,也使其更难被识别。

理解并运用人工智能防护栏


大多数商业人工智能API都提供某种形式的AI防护机制。 谷歌的Gemini API会自动对其输出内容进行四类安全评级:仇恨言论、骚扰、色情内容及危险内容。若使用Azure的OpenAI API,则会基于"仇恨与公平"、"色情"、"暴力"及"自残"等内容过滤器进行类似评级。当任何类别评分过高时,这两种API都会拒绝查询请求,但中等安全级别的审核仍由用户自行决定。

若使用Llama-2或Mistral等开源模型,则需自行构建内容过滤器。可通过调用专有分类器(如OpenAI内容过滤APIAzure AI内容安全API)或开源解决方案(如Meta新发布的LlamaGuard)实现。 LlamaGuard是一款基于70亿参数的LLM模型,基准测试表现优异。该模型在提示词与响应分类以及通用内容审核领域均展现出良好潜力。

确保人类仍参与其中,且您的流程符合法规要求。


无论您使用何种自动化工具来保护用户和业务,没有任何技术能提供绝对保障。所有人工智能工具都难免出错,您必须确保这些错误不会导致运营风险、客户风险或监管风险。

首先,人工干预始终不可或缺——至少需要有人类参与审核工具标记的内容。当然,内容审核流程必须兼顾效率与效果。颇具讽刺意味的是,随着市场上人工智能工具日益普及(例如内容生成或内容审核工具),某些场景下反而需要投入更多人力进行人工干预。

其次,任何内容审核流程和实践都应以用户安全与留存——进而以业务发展——为核心考量。 若审核失误引发争议该如何应对?如何确保用户在必要时能对人工或AI的决策提出修正意见?如何保障审核人员高效精准地做出最佳审核判断?管理这些复杂问题需要您精心设计并有效自动化流程,例如采用Tremau内容审核平台等工具。

最后,2024年将成为企业必须加倍努力确保自身不被监管机构罚款的关键之年。欧盟《数字服务法案》将正式适用于所有在欧洲运营的在线平台,要求企业重新设计业务流程并提交各类报告(如透明度报告),否则将面临罚款。无论平台是否受人工智能影响或使用人工智能技术,合规都是必不可少的。

我们能为您提供什么帮助? 在Checkfor.ai和Tremau,我们致力于助您在强大的人工智能与新规并存的新世界中游刃有余。

如需了解更多信息,请通过以下邮箱联系我们:info@tremau.cominfo@pangram.com



西奥多罗斯·埃夫盖尼乌是Tremau联合创始人兼首席创新官、欧洲工商管理学院教授、经合组织人工智能专家网络成员、波士顿咨询公司亨德森研究院顾问,并曾担任世界经济论坛人工智能领域的学术合作伙伴。他拥有麻省理工学院四项学位,其中包括人工智能领域的博士学位。

马克斯·斯佩罗是Pangram Labs的联合创始人兼首席执行官。此前,他曾在谷歌和Nuro担任软件工程师,负责构建数据管道并训练机器学习模型。他拥有斯坦福大学计算机科学学士和硕士学位。

本文于2024年1月与Tremau联合发布。

订阅我们的电子报
我们每月分享人工智能检测研究的最新进展。
订阅
以获取我们的最新动态
随时掌握我们的最新资讯与优惠活动。
© 2025 Pangram。保留所有权利。