無論您是剛開始為Claude的API部署設定信任與安全,還是您的部署已經在運行,以下是在構建您自己的AI安全計劃時要考慮的一些策略。
基本安全保護
將ID與每個API調用連接存儲,以便在需要定位特定違規內容時,您有能力在系統中找到它。
考慮為用戶分配ID,這可以幫助您跟踪違反Anthropic AUP的特定個人,從而在濫用情況下採取更有針對性的行動。
通過API向Anthropic傳遞ID的選擇取決於您。 但是,如果提供,我們可以更精確地定位違規行為。 為了幫助保護終端用戶的隱私,傳遞的任何ID都應該是加密雜湊的。
考慮要求客戶在使用Claude之前在您的平台上註冊帳戶
確保您的客戶了解允許的用途
中級安全保護
創建自定義框架,該框架將終端用戶與Claude的交互限制在有限的提示集或只允許Claude審查您已經擁有的特定知識語料庫,這將減少用戶參與違規行為的能力。
啟用額外的安全過濾器 - Anthropic為幫助檢測潛在有害的提示並管理實時操作以減少傷害而構建的免費實時審查工具
有關如何啟用我們的其他安全過濾器的更多信息,請聯繫 usersafety@anthropic.com。
對於Bedrock客戶:
激活您的私有S3存儲桶以存儲提示和完成以供您自己評估
高級安全保護
在將提示發送到Claude之前,對所有終端用戶提示運行審核API,以確保它們不是有害的
全面安全保護
建立內部人工審查系統,以標記Claude(用於內容審核)或審核API標記為有害的提示,以便您可以干預以限制或刪除違規率高的用戶。