跳转到主要内容

API 安全防护工具

本周更新

无论您是刚开始为Claude的API部署设置安全防护措施,还是您的部署已经在运行,以下是在构建您自己的AI安全程序时需要考虑的一些策略。这些建议旨在帮助您遵守我们的服务条款使用政策,这些条款禁止Claude的某些用途。未能遵守条款使用政策可能导致您的服务访问权限被暂停或终止。

基础安全防护措施

  • 存储与每个API调用关联的ID,这样如果您需要精确定位特定的违规内容,您就能够在您的系统中找到它。

  • 考虑为用户分配ID,这可以帮助您跟踪违反Anthropic可接受使用政策的特定个人,在滥用情况下允许采取更有针对性的行动。

    • 是否选择通过API将ID传递给Anthropic由您决定。但是,如果提供了ID,我们可以更精确地定位违规行为。为了帮助保护最终用户的隐私,传递的任何ID都应该进行加密哈希处理。

  • 考虑要求客户在使用Claude之前在您的平台上注册账户

  • 确保您的客户了解允许的用途

  • 对反复违反Anthropic服务条款使用政策的用户进行警告、限制或暂停

中级安全防护措施

  • 创建定制化框架,将最终用户与Claude的交互限制在有限的提示集合内,或仅允许Claude审查您已有的特定知识库,这将减少用户从事违规行为的能力。

  • 启用额外的安全过滤器 - 由Anthropic构建的免费实时审核工具,用于帮助检测潜在有害提示并管理实时行动以减少伤害

  • 对于Bedrock客户:

    • 激活您的私有S3存储桶,以便存储提示和完成内容供您自己评估

高级安全防护措施

全面安全防护措施

  • 建立内部人工审查系统,标记被Claude(用于内容审核)或审核API标记为有害的提示,以便您可以干预限制或移除违规率高的用户。

这是否解答了您的问题?