Egal, ob Sie gerade erst mit der Einrichtung von Schutzmaßnahmen für Ihre API-Bereitstellung von Claude beginnen oder Ihre Bereitstellung bereits läuft, hier sind einige Strategien, die Sie beim Aufbau Ihres eigenen KI-Sicherheitsprogramms berücksichtigen sollten. Diese Vorschläge sollen Ihnen dabei helfen, unsere Nutzungsbedingungen und Nutzungsrichtlinien einzuhalten, die bestimmte Verwendungen von Claude verbieten. Die Nichteinhaltung der Nutzungsbedingungen und Nutzungsrichtlinien kann zur Aussetzung oder Beendigung Ihres Zugangs zu den Diensten führen.
Grundlegende Schutzmaßnahmen
Speichern Sie IDs, die mit jedem API-Aufruf verknüpft sind, damit Sie bei Bedarf spezifische regelwidrige Inhalte in Ihren Systemen finden können.
Erwägen Sie die Zuweisung von IDs an Benutzer, was Ihnen helfen kann, bestimmte Personen zu verfolgen, die gegen Anthropics AUP verstoßen, und ermöglicht gezielteren Maßnahmen bei Missbrauch.
Die Entscheidung, IDs über die API an Anthropic zu übermitteln, liegt bei Ihnen. Falls bereitgestellt, können wir jedoch Verstöße präziser lokalisieren. Zum Schutz der Privatsphäre der Endbenutzer sollten alle übermittelten IDs kryptographisch gehasht werden.
Erwägen Sie, von Kunden zu verlangen, sich für ein Konto auf Ihrer Plattform anzumelden, bevor sie Claude nutzen
Stellen Sie sicher, dass Ihre Kunden die erlaubten Verwendungen verstehen
Warnen, drosseln oder sperren Sie Benutzer, die wiederholt gegen Anthropics Nutzungsbedingungen und Nutzungsrichtlinien verstoßen
Mittlere Schutzmaßnahmen
Erstellen Sie Anpassungsrahmen, die Endbenutzer-Interaktionen mit Claude auf eine begrenzte Anzahl von Prompts beschränken oder Claude nur erlauben, einen spezifischen Wissenskorpus zu überprüfen, den Sie bereits haben, was die Fähigkeit der Benutzer verringert, sich regelwidrig zu verhalten.
Aktivieren Sie zusätzliche Sicherheitsfilter - kostenlose Echtzeit-Moderationstools von Anthropic zur Erkennung potenziell schädlicher Prompts und zur Verwaltung von Echtzeit-Maßnahmen zur Schadensreduzierung
Für weitere Informationen zur Aktivierung unserer zusätzlichen Sicherheitsfilter wenden Sie sich bitte an usersafety@anthropic.com.
Für Bedrock-Kunden:
Aktivieren Sie Ihren privaten S3-Bucket, um Prompts und Vervollständigungen für Ihre eigene Bewertung zu speichern
Erweiterte Schutzmaßnahmen
Führen Sie eine Moderations-API gegen alle Endbenutzer-Prompts aus, bevor sie an Claude gesendet werden, um sicherzustellen, dass sie nicht schädlich sind
Umfassende Schutzmaßnahmen
Richten Sie ein internes menschliches Überprüfungssystem ein, um Prompts zu kennzeichnen, die von Claude (bei Verwendung für Inhaltsmoderation) oder einer Moderations-API als schädlich markiert werden, damit Sie eingreifen können, um Benutzer mit hohen Verstoßraten zu beschränken oder zu entfernen.