메인 콘텐츠로 건너뛰기

API 보안 도구

이번 주에 업데이트함

Claude의 API 배포를 위한 보안 조치를 설정하는 과정을 막 시작했거나 이미 배포가 실행 중인 경우, 자체 AI 안전 프로그램을 구축할 때 고려해야 할 몇 가지 전략을 소개합니다. 이러한 제안은 Claude의 특정 사용을 금지하는 당사의 서비스 약관사용 정책을 준수하는 데 도움이 되도록 설계되었습니다. 약관사용 정책을 준수하지 않을 경우 서비스 이용이 중단되거나 종료될 수 있습니다.

기본 보안 조치

  • 각 API 호출과 연결된 ID를 저장하여 특정 위반 콘텐츠를 정확히 찾아야 할 경우 시스템에서 찾을 수 있도록 합니다.

  • 사용자에게 ID를 할당하는 것을 고려해보세요. 이를 통해 Anthropic의 AUP를 위반하는 특정 개인을 추적할 수 있어 오남용 사례에서 보다 표적화된 조치를 취할 수 있습니다.

    • API를 통해 Anthropic에 ID를 전달할지 여부는 귀하의 선택입니다. 하지만 제공될 경우 위반 사항을 더 정확하게 찾아낼 수 있습니다. 최종 사용자의 개인정보를 보호하기 위해 전달되는 모든 ID는 암호화 해시 처리되어야 합니다.

  • Claude를 이용하기 전에 고객이 플랫폼에 계정을 등록하도록 요구하는 것을 고려해보세요

  • 고객이 허용된 사용법을 이해하도록 보장하세요

  • Anthropic의 서비스 약관사용 정책을 반복적으로 위반하는 사용자에게 경고, 제한 또는 이용 정지 조치를 취하세요

중급 보안 조치

  • 최종 사용자와 Claude의 상호작용을 제한된 프롬프트 세트로 제한하거나 Claude가 이미 보유하고 있는 특정 지식 코퍼스만 검토할 수 있도록 하는 맞춤화 프레임워크를 만들어 사용자가 위반 행위에 참여할 수 있는 능력을 줄입니다.

  • 추가 안전 필터 활성화 - 잠재적으로 유해한 프롬프트를 감지하고 피해를 줄이기 위한 실시간 조치를 관리하는 데 도움이 되는 Anthropic에서 구축한 무료 실시간 조정 도구

    • 추가 안전 필터 활성화 방법에 대한 자세한 정보는 usersafety@anthropic.com으로 문의해 주세요.

  • Bedrock 고객의 경우:

    • 자체 평가를 위해 프롬프트와 완성 결과를 저장하기 위해 개인 S3 버킷을 활성화하세요

고급 보안 조치

포괄적 보안 조치

  • Claude(콘텐츠 조정에 사용) 또는 조정 API에 의해 유해한 것으로 표시된 프롬프트를 플래그하는 내부 인간 검토 시스템을 설정하여 위반율이 높은 사용자를 제한하거나 제거하기 위해 개입할 수 있도록 합니다.

답변이 도움되었나요?