全部系列
隱私權和法律
您如何在模型訓練中使用個人數據?
您如何在模型訓練中使用個人數據?
一週前已更新

像Claude這樣的大型語言模型需要通過文本「訓練」來學習單詞之間的模式和聯繫。這種訓練對於模型的有效和安全運行非常重要。

儘管我們無意對個人數據進行「訓練」,但像其他模型一樣,我們大型語言模型的訓練數據可能包含基於網絡的數據,其中可能包含公開可用的個人數據。我們使用三個來源的數據訓練模型:

  1. 網絡上公開可用的信息

  2. 我們從第三方企業獲取的數據集

  3. 用戶或眾包工人提供的數據

我們採取措施最大限度地減少訓練過程中對個人的隱私影響。例如,我們遵循嚴格的政策和指南,不訪問密碼保護的網頁或繞過驗證碼控制。我們對獲取的數據集進行盡職調查。並鼓勵用戶不要使用我們的產品和服務處理個人數據。 此外,我們的模型經過尊重隱私的訓練:Claude的核心「原則」之一基於《世界人權宣言》,即選擇最尊重每個人隱私、獨立性、聲譽、家庭、財產權和結社權利的回應。

除非:(1)您的對話因信任和安全審查而被標記(在這種情況下,我們可能會使用或分析它們以提高我們執行可接受使用政策的能力,包括為我們的信任和安全團隊訓練模型,與Anthropic的安全使命一致),(2)您已明確向我們報告了材料(例如通過我們的反饋機制),或(3)以其他方式明確選擇參與訓練,否則我們不會使用您的輸入或輸出來訓練我們的模型。

我們的隱私政策解釋了您有關個人數據的權利,包括有關我們訓練活動的權利。這包括您索取個人數據副本的權利,以及反對我們處理您的個人數據或要求刪除的權利。我們盡一切努力回應此類請求。但是,請注意,這些權利是有限的,而我們可能需要採取行動來處理您有關我們訓練數據集的請求的過程很複雜。

要瞭解更多信息,或者如果您想知道如何就與隱私相關的主題聯繫我們,請參閱我們的隱私政策

是否回答了您的問題?