無論您是剛開始為Claude的API部署設置安全防護措施,還是您的部署已經在運行,以下是在建立您自己的AI安全計劃時需要考慮的一些策略。這些建議旨在幫助您遵守我們的服務條款和使用政策,這些條款禁止Claude的某些用途。未能遵守條款和使用政策可能導致您的服務存取權限被暫停或終止。
基本安全防護措施
儲存與每個API調用相關聯的ID,這樣如果您需要精確定位特定的違規內容,您就有能力在您的系統中找到它。
考慮為用戶分配ID,這可以幫助您追蹤違反Anthropic使用政策的特定個人,在濫用情況下允許採取更有針對性的行動。
是否選擇通過API將ID傳遞給Anthropic由您決定。但是,如果提供,我們可以更精確地定位違規行為。為了幫助保護終端用戶的隱私,任何傳遞的ID都應該進行加密雜湊處理。
考慮要求客戶在使用Claude之前在您的平台上註冊帳戶
確保您的客戶了解允許的用途
中級安全防護措施
創建自定義框架,將終端用戶與Claude的互動限制在有限的提示集合內,或僅允許Claude審查您已有的特定知識庫,這將減少用戶從事違規行為的能力。
啟用額外的安全過濾器 - 由Anthropic構建的免費實時審核工具,用於幫助檢測潛在有害提示並管理實時行動以減少傷害
有關如何啟用我們額外安全過濾器的更多信息,請聯繫usersafety@anthropic.com。
對於Bedrock客戶:
激活您的私有S3存儲桶,以便儲存提示和完成內容供您自己評估
高級安全防護措施
在所有終端用戶提示發送給Claude之前,對其運行審核API以確保它們不是有害的
全面安全防護措施
建立內部人工審查系統,標記被Claude(用於內容審核)或審核API標記為有害的提示,以便您可以介入限制或移除違規率高的用戶。