API-Sicherheitsmaßnahmen-Tools

Unabhängig davon, ob Sie gerade erst damit beginnen, Schutzmaßnahmen für Ihre API-Bereitstellung von Claude einzurichten, oder ob Ihre Bereitstellung bereits läuft, hier sind einige Strategien, die Sie beim Aufbau Ihres eigenen KI-Sicherheitsprogramms in Betracht ziehen sollten. Diese Vorschläge sollen Ihnen helfen, unsere Nutzungsbedingungen und Nutzungsrichtlinien einzuhalten, die bestimmte Verwendungen von Claude verbieten. Die Nichteinhaltung der Nutzungsbedingungen und Nutzungsrichtlinien kann zur Aussetzung oder Beendigung Ihres Zugangs zu den Diensten führen.

Grundlegende Schutzmaßnahmen

Speichern Sie IDs, die mit jedem API-Aufruf verknüpft sind, damit Sie bei Bedarf spezifische regelwidrige Inhalte in Ihren Systemen finden können.
Erwägen Sie die Zuweisung von IDs an Benutzer, was Ihnen helfen kann, bestimmte Personen zu verfolgen, die gegen die Nutzungsrichtlinien von Anthropic verstoßen, und so ein gezielteres Vorgehen bei Missbrauchsfällen ermöglicht.
- Die Entscheidung, IDs über die API an Anthropic zu übermitteln, liegt bei Ihnen. Wenn sie jedoch bereitgestellt werden, können wir Verstöße präziser lokalisieren. Um die Privatsphäre der Endnutzer zu schützen, sollten alle übermittelten IDs kryptografisch gehasht sein.
Erwägen Sie, von Kunden die Erstellung eines Kontos auf Ihrer Plattform zu verlangen, bevor sie Claude nutzen können
Stellen Sie sicher, dass Ihre Kunden die erlaubten Nutzungen verstehen
Warnen, drosseln oder sperren Sie Benutzer, die wiederholt gegen die Nutzungsbedingungen und Nutzungsrichtlinien von Anthropic verstoßen

Mittlere Schutzmaßnahmen

Erstellen Sie Anpassungsrahmen, die die Interaktionen der Endnutzer mit Claude auf eine begrenzte Anzahl von Prompts beschränken oder Claude nur erlauben, einen spezifischen Wissenskorpus zu überprüfen, den Sie bereits haben. Dies wird die Möglichkeit der Benutzer, regelwidriges Verhalten zu zeigen, verringern.
Aktivieren Sie zusätzliche Sicherheitsfilter - kostenlose Echtzeit-Moderationstools, die von Anthropic entwickelt wurden, um potenziell schädliche Prompts zu erkennen und Echtzeit-Aktionen zur Schadensminderung zu verwalten
- Für weitere Informationen darüber, wie Sie unsere zusätzlichen Sicherheitsfilter aktivieren können, wenden Sie sich bitte an usersafety@anthropic.com.
Für Bedrock-Kunden:
- Aktivieren Sie Ihren privaten S3-Bucket, um Prompts und Vervollständigungen für Ihre eigene Auswertung zu speichern

Fortgeschrittene Schutzmaßnahmen

Verwenden Sie Claude für Ihre Inhaltsmoderation
Führen Sie eine Moderations-API gegen alle Endbenutzer-Prompts aus, bevor sie an Claude gesendet werden, um sicherzustellen, dass sie nicht schädlich sind

Umfassende Schutzmaßnahmen

Richten Sie ein internes System zur menschlichen Überprüfung ein, um Prompts zu kennzeichnen, die von Claude (der für die Inhaltsmoderation verwendet wird) oder einer Moderations-API als schädlich markiert wurden, damit Sie eingreifen können, um Benutzer mit hohen Verstoßraten einzuschränken oder zu entfernen.

Verwandte Artikel

Unser Ansatz zur Benutzersicherheit

Ich plane, ein Produkt mit Claude auf den Markt zu bringen. Welche Schritte sollte ich unternehmen, um sicherzustellen, dass ich nicht gegen die Nutzungsrichtlinien von Anthropic verstoße?

Schutzmaßnahmen, Warnungen und Einsprüche

Fungiert Anthropic als Datenverarbeiter oder Verantwortlicher?

Verantwortungsvoller Einsatz von Anthropics Modellen: Richtlinien für Organisationen, die Minderjährige betreuen