Anthropic

Baik Anda baru memulai proses pengaturan Trust &amp; Safety untuk penerapan API Claude, atau penerapan Anda sudah berjalan, berikut adalah beberapa strategi yang perlu dipertimbangkan saat membangun program keamanan AI Anda sendiri. Saran-saran ini dirancang untuk membantu Anda mematuhi <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Ketentuan Layanan</a> dan <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Kebijakan Penggunaan</a> kami, yang melarang penggunaan tertentu dari Claude. Kegagalan untuk mematuhi <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Ketentuan</a> dan <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Kebijakan Penggunaan</a> dapat mengakibatkan penangguhan atau penghentian akses Anda ke layanan.

Simpan ID yang terkait dengan setiap panggilan API, sehingga jika Anda perlu menunjukkan konten spesifik yang melanggar, Anda memiliki kemampuan untuk menemukannya dalam sistem Anda.

Pertimbangkan untuk menetapkan ID kepada pengguna, yang dapat membantu Anda melacak individu tertentu yang melanggar AUP Anthropic, memungkinkan tindakan yang lebih terarah dalam kasus penyalahgunaan.

-  
  Pilihan untuk <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">meneruskan ID ke Anthropic melalui API</a> terserah Anda. Namun, jika disediakan, kami dapat menunjukkan pelanggaran dengan lebih tepat. Untuk membantu melindungi privasi pengguna akhir, setiap ID yang diteruskan harus di-hash secara kriptografis.
   

Pertimbangkan untuk mewajibkan pelanggan mendaftar akun di platform Anda sebelum menggunakan Claude

Pastikan pelanggan Anda memahami penggunaan yang diizinkan

Peringatkan, batasi, atau tangguhkan pengguna yang berulang kali melanggar <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Ketentuan Layanan</a> dan <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Kebijakan Penggunaan</a> Anthropic

-  
  Simpan ID yang terkait dengan setiap panggilan API, sehingga jika Anda perlu menunjukkan konten spesifik yang melanggar, Anda memiliki kemampuan untuk menemukannya dalam sistem Anda.
   
-  
  Pertimbangkan untuk menetapkan ID kepada pengguna, yang dapat membantu Anda melacak individu tertentu yang melanggar AUP Anthropic, memungkinkan tindakan yang lebih terarah dalam kasus penyalahgunaan.
   
  -  
    Pilihan untuk <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">meneruskan ID ke Anthropic melalui API</a> terserah Anda. Namun, jika disediakan, kami dapat menunjukkan pelanggaran dengan lebih tepat. Untuk membantu melindungi privasi pengguna akhir, setiap ID yang diteruskan harus di-hash secara kriptografis.
     
   
-  
  Pertimbangkan untuk mewajibkan pelanggan mendaftar akun di platform Anda sebelum menggunakan Claude
   
-  
  Pastikan pelanggan Anda memahami penggunaan yang diizinkan
   
-  
  Peringatkan, batasi, atau tangguhkan pengguna yang berulang kali melanggar <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Ketentuan Layanan</a> dan <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Kebijakan Penggunaan</a> Anthropic
   

Buat kerangka kustomisasi yang membatasi interaksi pengguna akhir dengan Claude ke serangkaian prompt terbatas atau hanya mengizinkan Claude untuk meninjau korpus pengetahuan spesifik yang sudah Anda miliki, yang akan mengurangi kemampuan pengguna untuk terlibat dalam perilaku yang melanggar.

Aktifkan filter keamanan tambahan - alat moderasi real-time gratis yang dibuat oleh Anthropic untuk membantu mendeteksi prompt yang berpotensi berbahaya dan mengelola tindakan real-time untuk mengurangi bahaya

-  
  Untuk informasi lebih lanjut tentang cara mengaktifkan filter keamanan tambahan kami, silakan hubungi <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
   

-  
  Aktifkan bucket S3 pribadi Anda untuk menyimpan prompt dan penyelesaian untuk evaluasi Anda sendiri
   

-  
  Buat kerangka kustomisasi yang membatasi interaksi pengguna akhir dengan Claude ke serangkaian prompt terbatas atau hanya mengizinkan Claude untuk meninjau korpus pengetahuan spesifik yang sudah Anda miliki, yang akan mengurangi kemampuan pengguna untuk terlibat dalam perilaku yang melanggar.
   
-  
  Aktifkan filter keamanan tambahan - alat moderasi real-time gratis yang dibuat oleh Anthropic untuk membantu mendeteksi prompt yang berpotensi berbahaya dan mengelola tindakan real-time untuk mengurangi bahaya
   
  -  
    Untuk informasi lebih lanjut tentang cara mengaktifkan filter keamanan tambahan kami, silakan hubungi <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
     
   
-  
  <i>Untuk Pelanggan Bedrock:</i>
   
  -  
    Aktifkan bucket S3 pribadi Anda untuk menyimpan prompt dan penyelesaian untuk evaluasi Anda sendiri
     
   

<a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Gunakan Claude untuk moderasi konten Anda</a>

Jalankan API moderasi terhadap semua prompt pengguna akhir sebelum dikirim ke Claude untuk memastikan mereka tidak berbahaya

-  
  <a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Gunakan Claude untuk moderasi konten Anda</a>
   
-  
  Jalankan API moderasi terhadap semua prompt pengguna akhir sebelum dikirim ke Claude untuk memastikan mereka tidak berbahaya
   

Siapkan sistem peninjauan manusia internal untuk menandai prompt yang ditandai oleh Claude (yang digunakan untuk moderasi konten) atau API moderasi sebagai berbahaya sehingga Anda dapat melakukan intervensi untuk membatasi atau menghapus pengguna dengan tingkat pelanggaran tinggi.

-  
  Siapkan sistem peninjauan manusia internal untuk menandai prompt yang ditandai oleh Claude (yang digunakan untuk moderasi konten) atau API moderasi sebagai berbahaya sehingga Anda dapat melakukan intervensi untuk membatasi atau menghapus pengguna dengan tingkat pelanggaran tinggi.
   

Alat Kepercayaan & Keamanan API