Lewati ke konten utama

Alat Perlindungan API

Diperbarui minggu ini

Baik Anda baru memulai proses pengaturan perlindungan untuk deployment API Claude Anda, atau deployment Anda sudah berjalan, berikut adalah beberapa strategi yang perlu dipertimbangkan saat membangun program keamanan AI Anda sendiri. Saran-saran ini dirancang untuk membantu Anda mematuhi Ketentuan Layanan dan Kebijakan Penggunaan kami, yang melarang penggunaan tertentu dari Claude. Kegagalan untuk mematuhi Ketentuan dan Kebijakan Penggunaan dapat mengakibatkan penangguhan atau penghentian akses Anda ke layanan.

Perlindungan Dasar

  • Simpan ID yang terhubung dengan setiap panggilan API, sehingga jika Anda perlu menunjuk konten pelanggaran tertentu, Anda memiliki kemampuan untuk menemukannya di sistem Anda.

  • Pertimbangkan untuk menetapkan ID kepada pengguna, yang dapat membantu Anda melacak individu tertentu yang melanggar AUP Anthropic, memungkinkan tindakan yang lebih terarah dalam kasus penyalahgunaan.

    • Pilihan untuk meneruskan ID ke Anthropic melalui API terserah Anda. Namun, jika disediakan, kami dapat menunjuk pelanggaran dengan lebih tepat. Untuk membantu melindungi privasi pengguna akhir, setiap ID yang diteruskan harus di-hash secara kriptografis.

  • Pertimbangkan untuk mengharuskan pelanggan mendaftar akun di platform Anda sebelum menggunakan Claude

  • Pastikan pelanggan Anda memahami penggunaan yang diizinkan

  • Beri peringatan, batasi, atau tangguhkan pengguna yang berulang kali melanggar Ketentuan Layanan dan Kebijakan Penggunaan Anthropic

Perlindungan Menengah

  • Buat kerangka kustomisasi yang membatasi interaksi pengguna akhir dengan Claude pada serangkaian prompt terbatas atau hanya memungkinkan Claude untuk meninjau korpus pengetahuan tertentu yang sudah Anda miliki, yang akan mengurangi kemampuan pengguna untuk terlibat dalam perilaku pelanggaran.

  • Aktifkan filter keamanan tambahan - alat moderasi real-time gratis yang dibangun oleh Anthropic untuk membantu mendeteksi prompt yang berpotensi berbahaya dan mengelola tindakan real-time untuk mengurangi bahaya

    • Untuk informasi lebih lanjut tentang cara mengaktifkan filter keamanan tambahan kami, silakan hubungi usersafety@anthropic.com.

  • Untuk Pelanggan Bedrock:

    • Aktifkan bucket S3 pribadi Anda untuk menyimpan prompt dan penyelesaian untuk evaluasi Anda sendiri

Perlindungan Lanjutan

Perlindungan Komprehensif

  • Siapkan sistem tinjauan manusia internal untuk menandai prompt yang ditandai oleh Claude (yang digunakan untuk moderasi konten) atau API moderasi sebagai berbahaya sehingga Anda dapat melakukan intervensi untuk membatasi atau menghapus pengguna dengan tingkat pelanggaran tinggi.

Apakah pertanyaan Anda terjawab?