我們對用戶安全的方法 | Anthropic Help Center

用戶安全是Anthropic創建可靠、可解釋和可控制AI系統使命的核心。隨著我們推出讓人們與Claude互動的新方式，我們也預期會看到新類型的潛在危害出現，無論是透過產生錯誤資訊、令人反感的內容、仇恨言論或其他濫用行為。我們正積極投資並實驗額外的安全功能，以補充我們現有的模型安全工作，並致力於為廣大受眾提供有用的工具，同時盡力減輕危害。以開放測試版推出新產品讓我們能夠實驗、迭代並聽取您的回饋。以下是我們已引入的一些安全功能：

基於我們的使用政策標記潛在有害內容的檢測模型。
提示的安全過濾器，當我們的檢測模型將內容標記為有害時，可能會阻止模型的回應。
增強安全過濾器，讓我們能夠提高檢測模型的敏感度。我們可能會暫時對重複違反我們政策的用戶應用增強安全過濾器，並在一段時間沒有或很少違規後移除這些控制。

這些功能並非萬無一失，我們可能會因誤報或漏報而犯錯。您對這些措施以及我們如何向用戶解釋這些措施的回饋，將在幫助我們改善這些安全系統方面發揮關鍵作用，我們鼓勵您透過usersafety@anthropic.com與我們聯繫，提供任何您可能有的回饋。要了解更多資訊，請閱讀我們對AI安全的核心觀點。

我正在計劃使用Claude推出一個產品。我應該採取哪些步驟來確保不違反Anthropic的使用政策？

我想要在免費的 Claude.ai 或我的 Pro/Max 帳戶中輸入敏感資料。誰可以查看我的對話？

API 安全防護工具

Anthropic模型的負責任使用：為服務未成年人的組織提供的指導原則

我們使用政策的例外情況