無論您是剛開始為Claude的API部署設置信任與安全措施,還是您的部署已經在運行中,以下是在建立自己的AI安全計劃時可以考慮的一些策略。
基本保護措施
存儲與每個API調用相關聯的ID,以便在需要時能夠在您的系統中精確定位特定的違規內容。
考慮為用戶分配ID,這可以幫助您追踪違反Anthropic可接受使用政策的特定個人,從而在濫用情況下採取更有針對性的行動。
是否通過API將ID傳遞給Anthropic由您決定。但如果提供,我們可以更精確地定位違規行為。為了幫助保護最終用戶的隱私,任何傳遞的ID都應該進行加密哈希處理。
考慮要求客戶在使用Claude之前在您的平台上註冊帳戶
確保您的客戶了解允許的使用方式
中級保護措施
創建自定義框架,將最終用戶與Claude的互動限制在一組有限的提示中,或只允許Claude審查您已有的特定知識庫,這將減少用戶進行違規行為的能力。
啟用額外的安全過濾器 - Anthropic構建的免費實時審核工具,用於幫助檢測潛在有害的提示並管理實時行動以減少傷害
有關如何啟用我們的額外安全過濾器的更多信息,請聯繫usersafety@anthropic.com。
對於Bedrock客戶:
激活您的私有S3存儲桶,以便存儲提示和完成內容供您自己評估
高級保護措施
在將所有最終用戶提示發送給Claude之前,對其運行審核API,以確保它們不會造成傷害
全面保護措施
設置內部人工審核系統,標記被Claude(用於內容審核)或審核API標記為有害的提示,以便您可以干預限制或移除違規率高的用戶。