Zum Hauptinhalt springen

API-Schutzmaßnahmen-Tools

Diese Woche aktualisiert

Egal, ob Sie gerade erst mit der Einrichtung von Schutzmaßnahmen für Ihre API-Bereitstellung von Claude beginnen oder Ihre Bereitstellung bereits läuft, hier sind einige Strategien, die Sie beim Aufbau Ihres eigenen KI-Sicherheitsprogramms berücksichtigen sollten. Diese Vorschläge sollen Ihnen dabei helfen, unsere Nutzungsbedingungen und Nutzungsrichtlinien einzuhalten, die bestimmte Verwendungen von Claude verbieten. Die Nichteinhaltung der Nutzungsbedingungen und Nutzungsrichtlinien kann zur Aussetzung oder Beendigung Ihres Zugangs zu den Diensten führen.

Grundlegende Schutzmaßnahmen

  • Speichern Sie IDs, die mit jedem API-Aufruf verknüpft sind, damit Sie bei Bedarf spezifische regelwidrige Inhalte in Ihren Systemen finden können.

  • Erwägen Sie die Zuweisung von IDs an Benutzer, was Ihnen helfen kann, bestimmte Personen zu verfolgen, die gegen Anthropics AUP verstoßen, und ermöglicht gezielteren Maßnahmen bei Missbrauch.

    • Die Entscheidung, IDs über die API an Anthropic zu übermitteln, liegt bei Ihnen. Falls bereitgestellt, können wir jedoch Verstöße präziser lokalisieren. Zum Schutz der Privatsphäre der Endbenutzer sollten alle übermittelten IDs kryptographisch gehasht werden.

  • Erwägen Sie, von Kunden zu verlangen, sich für ein Konto auf Ihrer Plattform anzumelden, bevor sie Claude nutzen

  • Stellen Sie sicher, dass Ihre Kunden die erlaubten Verwendungen verstehen

  • Warnen, drosseln oder sperren Sie Benutzer, die wiederholt gegen Anthropics Nutzungsbedingungen und Nutzungsrichtlinien verstoßen

Mittlere Schutzmaßnahmen

  • Erstellen Sie Anpassungsrahmen, die Endbenutzer-Interaktionen mit Claude auf eine begrenzte Anzahl von Prompts beschränken oder Claude nur erlauben, einen spezifischen Wissenskorpus zu überprüfen, den Sie bereits haben, was die Fähigkeit der Benutzer verringert, sich regelwidrig zu verhalten.

  • Aktivieren Sie zusätzliche Sicherheitsfilter - kostenlose Echtzeit-Moderationstools von Anthropic zur Erkennung potenziell schädlicher Prompts und zur Verwaltung von Echtzeit-Maßnahmen zur Schadensreduzierung

    • Für weitere Informationen zur Aktivierung unserer zusätzlichen Sicherheitsfilter wenden Sie sich bitte an usersafety@anthropic.com.

  • Für Bedrock-Kunden:

    • Aktivieren Sie Ihren privaten S3-Bucket, um Prompts und Vervollständigungen für Ihre eigene Bewertung zu speichern

Erweiterte Schutzmaßnahmen

Umfassende Schutzmaßnahmen

  • Richten Sie ein internes menschliches Überprüfungssystem ein, um Prompts zu kennzeichnen, die von Claude (bei Verwendung für Inhaltsmoderation) oder einer Moderations-API als schädlich markiert werden, damit Sie eingreifen können, um Benutzer mit hohen Verstoßraten zu beschränken oder zu entfernen.

Hat dies deine Frage beantwortet?