Anthropic

Baik Anda baru memulai proses menyiapkan Keamanan &amp; Keselamatan untuk penyebaran API Claude Anda, atau penyebaran Anda sudah berjalan, berikut ini adalah beberapa strategi yang perlu dipertimbangkan saat membangun program keamanan AI Anda sendiri.

Simpan ID yang terhubung dengan setiap panggilan API, sehingga jika Anda perlu mengetahui konten pelanggaran tertentu, Anda memiliki kemampuan untuk menemukannya di sistem Anda.

Pertimbangkan untuk memberikan ID kepada pengguna, yang dapat membantu Anda melacak individu tertentu yang melanggar AUP Anthropic, sehingga memungkinkan tindakan yang lebih terarah dalam kasus penyalahgunaan.

- Pilihan untuk <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">melewati ID ke Anthropic melalui API</a> terserah Anda. Tetapi, jika disediakan, kami dapat lebih tepat mengetahui pelanggaran. Untuk membantu melindungi privasi pengguna akhir, setiap ID yang dilewatkan sebaiknya di-hash secara kriptografis.

Pertimbangkan untuk mensyaratkan pelanggan mendaftar akun di platform Anda sebelum menggunakan Claude

Pastikan pelanggan Anda memahami penggunaan yang diizinkan

- Simpan ID yang terhubung dengan setiap panggilan API, sehingga jika Anda perlu mengetahui konten pelanggaran tertentu, Anda memiliki kemampuan untuk menemukannya di sistem Anda.
- Pertimbangkan untuk memberikan ID kepada pengguna, yang dapat membantu Anda melacak individu tertentu yang melanggar AUP Anthropic, sehingga memungkinkan tindakan yang lebih terarah dalam kasus penyalahgunaan.
   
  - Pilihan untuk <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">melewati ID ke Anthropic melalui API</a> terserah Anda. Tetapi, jika disediakan, kami dapat lebih tepat mengetahui pelanggaran. Untuk membantu melindungi privasi pengguna akhir, setiap ID yang dilewatkan sebaiknya di-hash secara kriptografis.
- Pertimbangkan untuk mensyaratkan pelanggan mendaftar akun di platform Anda sebelum menggunakan Claude
- Pastikan pelanggan Anda memahami penggunaan yang diizinkan

Buat kerangka kustomisasi yang membatasi interaksi pengguna akhir dengan Claude hanya pada seperangkat prompt terbatas atau hanya mengizinkan Claude untuk meninjau korpus pengetahuan tertentu yang sudah Anda miliki, yang akan mengurangi kemampuan pengguna untuk terlibat dalam perilaku pelanggaran.

Aktifkan filter keamanan tambahan - alat moderasi real-time gratis yang dibangun oleh Anthropic untuk membantu mendeteksi prompt yang berpotensi berbahaya dan mengelola tindakan real-time untuk mengurangi bahaya

- Untuk informasi lebih lanjut tentang cara mengaktifkan filter keamanan tambahan kami, silakan hubungi <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.

- Aktifkan bucket S3 pribadi Anda untuk menyimpan prompt dan penyelesaian untuk evaluasi Anda sendiri

- Buat kerangka kustomisasi yang membatasi interaksi pengguna akhir dengan Claude hanya pada seperangkat prompt terbatas atau hanya mengizinkan Claude untuk meninjau korpus pengetahuan tertentu yang sudah Anda miliki, yang akan mengurangi kemampuan pengguna untuk terlibat dalam perilaku pelanggaran.
- Aktifkan filter keamanan tambahan - alat moderasi real-time gratis yang dibangun oleh Anthropic untuk membantu mendeteksi prompt yang berpotensi berbahaya dan mengelola tindakan real-time untuk mengurangi bahaya
   
  - Untuk informasi lebih lanjut tentang cara mengaktifkan filter keamanan tambahan kami, silakan hubungi <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
- <i>Untuk Pelanggan Bedrock:</i>
   
  - Aktifkan bucket S3 pribadi Anda untuk menyimpan prompt dan penyelesaian untuk evaluasi Anda sendiri

<a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Gunakan Claude untuk moderasi konten Anda</a>

Jalankan API moderasi terhadap semua prompt pengguna akhir sebelum dikirim ke Claude untuk memastikan tidak berbahaya

- <a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Gunakan Claude untuk moderasi konten Anda</a>
- Jalankan API moderasi terhadap semua prompt pengguna akhir sebelum dikirim ke Claude untuk memastikan tidak berbahaya

Siapkan sistem tinjauan manusia internal untuk menandai prompt yang ditandai oleh Claude (digunakan untuk moderasi konten) atau API moderasi sebagai berbahaya sehingga Anda dapat campur tangan untuk membatasi atau menghapus pengguna dengan tingkat pelanggaran tinggi.

- Siapkan sistem tinjauan manusia internal untuk menandai prompt yang ditandai oleh Claude (digunakan untuk moderasi konten) atau API moderasi sebagai berbahaya sehingga Anda dapat campur tangan untuk membatasi atau menghapus pengguna dengan tingkat pelanggaran tinggi.