Claude의 API 배포를 위한 보안 조치를 설정하는 과정을 막 시작했거나 이미 배포가 실행 중인 경우, 자체 AI 안전 프로그램을 구축할 때 고려해야 할 몇 가지 전략을 소개합니다. 이러한 제안은 Claude의 특정 사용을 금지하는 당사의 서비스 약관 및 사용 정책을 준수하는 데 도움이 되도록 설계되었습니다. 약관 및 사용 정책을 준수하지 않을 경우 서비스 이용이 중단되거나 종료될 수 있습니다.
기본 보안 조치
각 API 호출과 연결된 ID를 저장하여 특정 위반 콘텐츠를 정확히 찾아야 할 경우 시스템에서 찾을 수 있도록 합니다.
사용자에게 ID를 할당하는 것을 고려해보세요. 이를 통해 Anthropic의 AUP를 위반하는 특정 개인을 추적할 수 있어 오남용 사례에서 보다 표적화된 조치를 취할 수 있습니다.
API를 통해 Anthropic에 ID를 전달할지 여부는 귀하의 선택입니다. 하지만 제공될 경우 위반 사항을 더 정확하게 찾아낼 수 있습니다. 최종 사용자의 개인정보를 보호하기 위해 전달되는 모든 ID는 암호화 해시 처리되어야 합니다.
Claude를 이용하기 전에 고객이 플랫폼에 계정을 등록하도록 요구하는 것을 고려해보세요
고객이 허용된 사용법을 이해하도록 보장하세요
중급 보안 조치
최종 사용자와 Claude의 상호작용을 제한된 프롬프트 세트로 제한하거나 Claude가 이미 보유하고 있는 특정 지식 코퍼스만 검토할 수 있도록 하는 맞춤화 프레임워크를 만들어 사용자가 위반 행위에 참여할 수 있는 능력을 줄입니다.
추가 안전 필터 활성화 - 잠재적으로 유해한 프롬프트를 감지하고 피해를 줄이기 위한 실시간 조치를 관리하는 데 도움이 되는 Anthropic에서 구축한 무료 실시간 조정 도구
추가 안전 필터 활성화 방법에 대한 자세한 정보는 usersafety@anthropic.com으로 문의해 주세요.
Bedrock 고객의 경우:
자체 평가를 위해 프롬프트와 완성 결과를 저장하기 위해 개인 S3 버킷을 활성화하세요
고급 보안 조치
모든 최종 사용자 프롬프트가 Claude로 전송되기 전에 조정 API를 실행하여 유해하지 않은지 확인하세요
포괄적 보안 조치
Claude(콘텐츠 조정에 사용) 또는 조정 API에 의해 유해한 것으로 표시된 프롬프트를 플래그하는 내부 인간 검토 시스템을 설정하여 위반율이 높은 사용자를 제한하거나 제거하기 위해 개입할 수 있도록 합니다.