无论您是刚刚开始为Claude的API部署设置信任与安全,还是您的部署已经在运行,这里有一些在构建自己的AI安全计划时要考虑的策略。
基本安全保障
存储与每个API调用相关联的ID,以便如果您需要定位特定违规内容,您有能力在自己的系统中找到它。
考虑为用户分配ID,这可以帮助您跟踪违反Anthropic AUP的特定个人,从而针对滥用情况采取更有针对性的行动。
选择通过API向Anthropic传递ID的决定权在您。但是,如果提供,我们可以更精确地定位违规行为。为了帮助保护最终用户的隐私,传递的任何ID都应该是加密哈希的。
考虑要求客户在使用Claude之前在您的平台上注册账号
确保您的客户了解允许的使用
中级安全保障
创建自定义框架,限制最终用户与Claude的交互仅限于有限的提示集或仅允许Claude审阅您已经拥有的特定知识语料库,这将减少用户参与违规行为的能力。
启用附加安全过滤器 - Anthropic构建的用于帮助检测潜在有害提示并管理实时操作以减少伤害的免费实时审核工具
有关如何启用我们的其他安全过滤器的更多信息,请联系 usersafety@anthropic.com。
针对Bedrock客户:
激活您的私有S3存储桶,以存储提示和完成以供您自己评估
高级安全保障
对所有最终用户提示运行审核API,以确保它们不是有害的,然后再将它们发送到Claude
综合安全保障
建立内部人工审核系统,对Claude标记的提示(用于内容审核)或审核API标记为有害的提示进行标记,以便您可以干预以限制或删除违规率高的用户。