我们创建Anthropic的目的是为了在AI研究和AI产品的前沿把安全性放在首位。我们的研究为我们的商业产品提供信息,而且我们的模型是目前可获得的最可靠安全和抵御滥用的模型之一。虽然我们的API仍处于封闭内测阶段,但我们正在根据用户反馈改进我们的安全过滤器 - 而且我们期望我们的商业客户在我们的安全功能失效时会问责我们。
但我们认为安全是一个共同的责任。我们的功能并非万无一失,坚定的合作伙伴是第二道防线。根据您的使用案例,整改措施的形式会有所不同,但以下是一些建议:
将Claude用作内容审核过滤器以识别和防止违规行为。
对于面向外部的产品,向用户披露他们正在与一个AI系统互动。
对于敏感信息和决策制定,请让合格的专业人员在向消费者传播内容之前对其进行审查。
我们鼓励您向usersafety@anthropic.com发送反馈或具体建议。对于现有的商业合作伙伴,我们建议您加入我们的Discord服务器,与其他开发者交流想法。