所有收藏
隐私和法律
您如何在模型训练中使用个人数据?
您如何在模型训练中使用个人数据?
一周前更新

像Claude这样的大型语言模型需要通过文本进行“训练”,以便它们可以学习词汇之间的模式和连接。这种训练对于模型的有效和安全运行非常重要。

尽管我们无意中使用个人数据来“训练”我们的模型,但像其他模型一样,我们大型语言模型的训练数据可能包含基于网络的公开个人数据。我们从三个来源训练我们的模型:

  1. 互联网公开信息

  2. 我们从第三方企业获得的许可数据集

  3. 我们用户或众包工人提供的数据

我们采取措施最大限度地减少训练过程对个人隐私的影响。例如,我们有严格的政策和准则,不访问密码保护页面或绕过验证码控制。我们对获得许可的数据进行尽职调查。我们还鼓励用户不要使用我们的产品和服务来处理个人数据。此外,我们的模型经过训练以尊重隐私:我们基于《世界人权宣言》制定的Claude宪法原则之一,就是选择最尊重每个人隐私、独立性、声誉、家庭、财产权和结社权利的回应。

除非:(1)您的对话因信任和安全审查而被标记(在这种情况下,我们可能会使用或分析它们以提高我们执行可接受使用政策的能力,包括为我们的信任和安全团队训练模型),或(2)您已明确向我们报告了这些材料(例如通过我们的反馈机制),或(3)通过其他方式明确选择参与训练,否则我们不会使用您的输入或输出来训练我们的模型。

我们的隐私政策解释了您对个人数据的权利,包括与我们的培训活动相关的权利。这包括您要求获取个人数据副本以及反对我们处理您的个人数据或要求删除的权利。我们会尽最大努力回应此类请求。但是,请注意,这些权利是有限的,我们可能需要采取行动来满足您关于我们培训数据集的请求的过程很复杂。

要了解更多信息,或者如果您想知道如何就与隐私相关的主题联系我们,请参阅我们的隐私政策

这是否解答了您的问题?