Ir para conteúdo principal

Como você usa dados pessoais no treinamento de modelos?

Atualizado há mais de uma semana

Este artigo é sobre nossos produtos comerciais (por exemplo, Claude for Work, Anthropic API). Para nossos produtos para consumidores (por exemplo, Claude Free, Claude Pro), veja aqui.

Sobre o treinamento de modelos

Grandes modelos de linguagem como o Claude são "treinados" em uma variedade de conteúdos como texto, imagens e multimídia para que possam aprender os padrões e conexões entre palavras e/ou conteúdo. Este treinamento é importante para que o modelo funcione de forma eficaz e segura.

Os modelos não armazenam texto como um banco de dados, nem simplesmente "misturam" ou fazem "colagens" de conteúdo existente. Os modelos identificam padrões gerais no texto para ajudar as pessoas a criar novo conteúdo, e não têm acesso aos dados de treinamento originais nem os utilizam uma vez que os modelos foram treinados.

Coleta de dados pessoais

As seguintes três fontes de dados de treinamento podem conter dados pessoais:

  1. Informações publicamente disponíveis via Internet

  2. Conjuntos de dados que obtemos sob acordos comerciais com empresas terceiras

  3. Dados que nossos usuários ou trabalhadores colaborativos fornecem

Não procuramos ativamente coletar dados pessoais para treinar nossos modelos. No entanto, uma grande quantidade de dados na Internet se relaciona a pessoas, então nossos dados de treinamento podem incluir dados pessoais incidentalmente.

Usamos apenas dados pessoais incluídos em nossos dados de treinamento para ajudar nossos modelos a aprender sobre linguagem e como entendê-la e responder a ela. Não usamos tais dados pessoais para contatar pessoas, construir perfis sobre elas, tentar vender ou comercializar algo para elas, ou vender as informações em si para qualquer terceiro.

Salvaguardas de Privacidade Durante a Coleta de Dados e Treinamento

Tomamos medidas para minimizar o impacto na privacidade dos indivíduos através do processo de treinamento. Operamos sob políticas e diretrizes rigorosas, por exemplo, não acessamos páginas protegidas por senha ou contornamos controles CAPTCHA. Realizamos due diligence nos dados que licenciamos. E encorajamos nossos usuários a não usar nossos produtos e serviços para processar dados pessoais.

Além disso, nossos modelos são especificamente treinados para respeitar a privacidade. Construímos salvaguardas-chave de 'privacidade por design' no desenvolvimento do Claude através de nossa adoção da "Constitutional AI". Isso dá ao Claude um conjunto de princípios (ou seja, uma "constituição") para orientar o treinamento dos LLMs Claude e fazer julgamentos sobre as saídas. Esses princípios são baseados em parte na Declaração Universal dos Direitos Humanos e incluem regras específicas sobre proteção da privacidade, particularmente de figuras não públicas. Isso treina os LLMs Claude para não divulgar ou repetir dados pessoais que podem ter sido capturados incidentalmente nos dados de treinamento, mesmo se solicitado. Por exemplo, Claude recebe os seguintes princípios como parte de sua "constituição": "Por favor, escolha a resposta que seja mais respeitosa da privacidade de todos" e "Por favor, escolha a resposta que tenha menos informações pessoais, privadas ou confidenciais pertencentes a outros". Para mais informações sobre como a "Constitutional AI" funciona, veja aqui.

Uso de dados para Ofertas Comerciais da Anthropic (por exemplo, Anthropic API & Console, Claude for Work (planos Team & Enterprise)

Por padrão, não usaremos suas Entradas ou Saídas para treinar nossos modelos.

Se você explicitamente nos reportar materiais (por exemplo, através de nossos mecanismos de feedback), ou de outra forma optar explicitamente pelo treinamento, então podemos usar esses materiais para treinar nossos modelos.

Para descobrir mais informações sobre seu uso de uma oferta comercial, ou se você gostaria de saber como nos contatar sobre um tópico relacionado à privacidade, veja nosso Trust Center e Termos Comerciais.

Direitos de Privacidade e Processamento de Dados

Nossa Política de Privacidade explica seus direitos em relação aos seus dados pessoais, incluindo com respeito às nossas atividades de treinamento. Isso inclui seu direito de solicitar uma cópia de seus dados pessoais, e de se opor ao nosso processamento de seus dados pessoais ou solicitar que sejam excluídos. Fazemos todos os esforços para responder a tais solicitações. No entanto, esteja ciente de que esses direitos são limitados, e que o processo pelo qual podemos precisar atender suas solicitações em relação ao nosso conjunto de dados de treinamento são complexos.

Para descobrir mais, ou se você gostaria de saber como nos contatar sobre um tópico relacionado à privacidade, veja nosso Trust Center e Política de Privacidade.

Por favor, note que a Política de Privacidade não se aplica onde a Anthropic atua como processadora de dados e processa dados pessoais em nome de clientes Comerciais usando os Serviços Comerciais da Anthropic. Nesses casos, o cliente comercial é o controlador, e você pode revisar suas políticas para mais informações sobre como eles lidam com seus dados pessoais.

Isto respondeu à sua pergunta?