Semua Koleksi
Kepercayaan & Keamanan
Alat Keamanan & Kepercayaan API
Alat Keamanan & Kepercayaan API
Diperbarui lebih dari satu minggu yang lalu

Baik Anda baru memulai proses menyiapkan Keamanan & Keselamatan untuk penyebaran API Claude Anda, atau penyebaran Anda sudah berjalan, berikut ini adalah beberapa strategi yang perlu dipertimbangkan saat membangun program keamanan AI Anda sendiri.

Pengamanan Dasar

  • Simpan ID yang terhubung dengan setiap panggilan API, sehingga jika Anda perlu mengetahui konten pelanggaran tertentu, Anda memiliki kemampuan untuk menemukannya di sistem Anda.

  • Pertimbangkan untuk memberikan ID kepada pengguna, yang dapat membantu Anda melacak individu tertentu yang melanggar AUP Anthropic, sehingga memungkinkan tindakan yang lebih terarah dalam kasus penyalahgunaan.

    • Pilihan untuk melewati ID ke Anthropic melalui API terserah Anda. Tetapi, jika disediakan, kami dapat lebih tepat mengetahui pelanggaran. Untuk membantu melindungi privasi pengguna akhir, setiap ID yang dilewatkan sebaiknya di-hash secara kriptografis.

  • Pertimbangkan untuk mensyaratkan pelanggan mendaftar akun di platform Anda sebelum menggunakan Claude

  • Pastikan pelanggan Anda memahami penggunaan yang diizinkan

Pengamanan Menengah

  • Buat kerangka kustomisasi yang membatasi interaksi pengguna akhir dengan Claude hanya pada seperangkat prompt terbatas atau hanya mengizinkan Claude untuk meninjau korpus pengetahuan tertentu yang sudah Anda miliki, yang akan mengurangi kemampuan pengguna untuk terlibat dalam perilaku pelanggaran.

  • Aktifkan filter keamanan tambahan - alat moderasi real-time gratis yang dibangun oleh Anthropic untuk membantu mendeteksi prompt yang berpotensi berbahaya dan mengelola tindakan real-time untuk mengurangi bahaya

    • Untuk informasi lebih lanjut tentang cara mengaktifkan filter keamanan tambahan kami, silakan hubungi usersafety@anthropic.com.

  • Untuk Pelanggan Bedrock:

    • Aktifkan bucket S3 pribadi Anda untuk menyimpan prompt dan penyelesaian untuk evaluasi Anda sendiri

Pengamanan Lanjutan

Pengamanan Komprehensif

  • Siapkan sistem tinjauan manusia internal untuk menandai prompt yang ditandai oleh Claude (digunakan untuk moderasi konten) atau API moderasi sebagai berbahaya sehingga Anda dapat campur tangan untuk membatasi atau menghapus pengguna dengan tingkat pelanggaran tinggi.

Apakah pertanyaan Anda terjawab?