Outils de Protection API | Anthropic Help Center

Que vous commenciez tout juste le processus de mise en place de mesures de protection pour votre déploiement API de Claude, ou que votre déploiement soit déjà en cours d'exécution, voici quelques stratégies à considérer lors de la création de votre propre programme de sécurité IA. Ces suggestions sont conçues pour vous aider à vous conformer à nos Conditions de Service et à notre Politique d'Utilisation, qui interdisent certaines utilisations de Claude. Le non-respect des Conditions et de la Politique d'Utilisation peut entraîner la suspension ou la résiliation de votre accès aux services.

Mesures de Protection de Base

Stockez les identifiants liés à chaque appel API, afin que si vous devez identifier un contenu spécifique en violation, vous ayez la capacité de le trouver dans vos systèmes.
Envisagez d'attribuer des identifiants aux utilisateurs, ce qui peut vous aider à suivre des individus spécifiques qui violent la Politique d'Utilisation Acceptable d'Anthropic, permettant une action plus ciblée en cas de mauvaise utilisation.
- Le choix de transmettre des identifiants à Anthropic via l'API vous appartient. Mais, s'ils sont fournis, nous pouvons identifier plus précisément les violations. Pour aider à protéger la vie privée des utilisateurs finaux, tous les identifiants transmis doivent être hachés cryptographiquement.
Envisagez d'exiger que les clients s'inscrivent pour un compte sur votre plateforme avant d'utiliser Claude
Assurez-vous que vos clients comprennent les utilisations autorisées
Avertissez, limitez ou suspendez les utilisateurs qui violent de manière répétée les Conditions de Service et la Politique d'Utilisation d'Anthropic

Mesures de Protection Intermédiaires

Créez des cadres de personnalisation qui limitent les interactions des utilisateurs finaux avec Claude à un ensemble limité d'invites ou permettent seulement à Claude d'examiner un corpus de connaissances spécifique que vous possédez déjà, ce qui diminuera la capacité des utilisateurs à adopter un comportement en violation.
Activez des filtres de sécurité supplémentaires - outils de modération en temps réel gratuits créés par Anthropic pour aider à détecter les invites potentiellement nuisibles et gérer les actions en temps réel pour réduire les dommages
- Pour plus d'informations sur la façon d'activer nos filtres de sécurité supplémentaires, veuillez contacter usersafety@anthropic.com.
Pour les Clients Bedrock :
- Activez votre compartiment S3 privé afin de stocker les invites et les complétions pour votre propre évaluation

Mesures de Protection Avancées

Utilisez Claude pour votre modération de contenu
Exécutez une API de modération contre toutes les invites des utilisateurs finaux avant qu'elles ne soient envoyées à Claude pour vous assurer qu'elles ne sont pas nuisibles

Mesures de Protection Complètes

Mettez en place un système interne de révision humaine pour signaler les invites qui sont marquées par Claude (utilisé pour la modération de contenu) ou une API de modération comme nuisibles afin que vous puissiez intervenir pour restreindre ou supprimer les utilisateurs avec des taux de violation élevés.