Anthropic

Seja você apenas iniciando o processo de configuração de salvaguardas para sua implantação de API do Claude, ou sua implantação já esteja em execução, aqui estão algumas estratégias a considerar ao construir seu próprio programa de segurança de IA. Essas sugestões são projetadas para ajudá-lo a cumprir nossos <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Termos de Serviço</a> e <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a>, que proíbem certos usos do Claude. O não cumprimento dos <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Termos</a> e <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> pode resultar na suspensão ou rescisão do seu acesso aos serviços.

Armazene IDs vinculados a cada chamada de API, para que, se você precisar identificar conteúdo específico que viole as regras, tenha a capacidade de encontrá-lo em seus sistemas.

Considere atribuir IDs aos usuários, o que pode ajudá-lo a rastrear indivíduos específicos que estão violando a AUP da Anthropic, permitindo ações mais direcionadas em casos de uso indevido.

- A escolha de <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">passar IDs para a Anthropic através da API</a> é sua. Mas, se fornecidos, podemos identificar violações com mais precisão. Para ajudar a proteger a privacidade dos usuários finais, quaisquer IDs passados devem ser criptograficamente hash.

Considere exigir que o cliente se cadastre para uma conta em sua plataforma antes de utilizar o Claude

Certifique-se de que seus clientes entendam os usos permitidos

Avise, limite ou suspenda usuários que violem repetidamente os <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Termos de Serviço</a> e <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> da Anthropic

- Armazene IDs vinculados a cada chamada de API, para que, se você precisar identificar conteúdo específico que viole as regras, tenha a capacidade de encontrá-lo em seus sistemas.
- Considere atribuir IDs aos usuários, o que pode ajudá-lo a rastrear indivíduos específicos que estão violando a AUP da Anthropic, permitindo ações mais direcionadas em casos de uso indevido.
  - A escolha de <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">passar IDs para a Anthropic através da API</a> é sua. Mas, se fornecidos, podemos identificar violações com mais precisão. Para ajudar a proteger a privacidade dos usuários finais, quaisquer IDs passados devem ser criptograficamente hash.
- Considere exigir que o cliente se cadastre para uma conta em sua plataforma antes de utilizar o Claude
- Certifique-se de que seus clientes entendam os usos permitidos
- Avise, limite ou suspenda usuários que violem repetidamente os <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Termos de Serviço</a> e <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> da Anthropic

Crie estruturas de personalização que restrinjam as interações do usuário final com o Claude a um conjunto limitado de prompts ou permitam apenas que o Claude revise um corpus de conhecimento específico que você já possui, o que diminuirá a capacidade dos usuários de se envolverem em comportamentos violativos.

Habilite filtros de segurança adicionais - ferramentas gratuitas de moderação em tempo real construídas pela Anthropic para ajudar a detectar prompts potencialmente prejudiciais e gerenciar ações em tempo real para reduzir danos

- Para mais informações sobre como habilitar nossos filtros de segurança adicionais, entre em contato com <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.

- Ative seu bucket S3 privado para armazenar prompts e conclusões para sua própria avaliação

- Crie estruturas de personalização que restrinjam as interações do usuário final com o Claude a um conjunto limitado de prompts ou permitam apenas que o Claude revise um corpus de conhecimento específico que você já possui, o que diminuirá a capacidade dos usuários de se envolverem em comportamentos violativos.
- Habilite filtros de segurança adicionais - ferramentas gratuitas de moderação em tempo real construídas pela Anthropic para ajudar a detectar prompts potencialmente prejudiciais e gerenciar ações em tempo real para reduzir danos
  - Para mais informações sobre como habilitar nossos filtros de segurança adicionais, entre em contato com <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
- <i>Para Clientes Bedrock:</i>
  - Ative seu bucket S3 privado para armazenar prompts e conclusões para sua própria avaliação

<a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Use o Claude para sua moderação de conteúdo</a>

Execute uma API de moderação contra todos os prompts do usuário final antes que sejam enviados ao Claude para garantir que não sejam prejudiciais

- <a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Use o Claude para sua moderação de conteúdo</a>
- Execute uma API de moderação contra todos os prompts do usuário final antes que sejam enviados ao Claude para garantir que não sejam prejudiciais

Configure um sistema interno de revisão humana para sinalizar prompts que são marcados pelo Claude (sendo usado para moderação de conteúdo) ou por uma API de moderação como prejudiciais, para que você possa intervir para restringir ou remover usuários com altas taxas de violação.

- Configure um sistema interno de revisão humana para sinalizar prompts que são marcados pelo Claude (sendo usado para moderação de conteúdo) ou por uma API de moderação como prejudiciais, para que você possa intervir para restringir ou remover usuários com altas taxas de violação.

Ferramentas de Proteção da API

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Encontre respostas e obtenha ajuda da Assistência da Intercom e de Especialistas da Comunidade

Este site utiliza cookies e outras tecnologias que nós e os nossos fornecedores terceiros utilizamos para monitorizar e registar informações pessoais sobre si, bem como as suas interações com o site (incluindo o conteúdo consultado, movimentos do cursor, gravações de ecrã e conteúdo de conversas) para os fins descritos na nossa Política de Cookies. Ao continuar a visitar o nosso site, concorda com os nossos {websiteTermsLink}, {privacyPolicyLink} e {cookiePolicyLink}.

Este site utiliza cookies e tecnologias semelhantes ("cookies") na medida do estritamente necessário para o funcionamento do site. Nós e os nossos parceiros também gostaríamos de instalar cookies adicionais para permitir a análise do desempenho do site, a funcionalidade, a publicidade e as caraterísticas das redes sociais. Consulte a nossa {cookiePolicyLink} para saber mais. Pode alterar as suas preferências de cookies nas nossas Definições de cookies.

Utilizamos cookies para o funcionamento do nosso site, bem como para fins de análise e publicidade. Pode ativar ou desativar os cookies opcionais, conforme desejado. Consulte a nossa {cookiePolicyLink} para obter mais informações.

Tens o direito de te opores à venda das tuas informações pessoais. Consulta a nossa {cookiePolicyLink} para obter mais informações sobre a forma como utilizamos os teus dados.

As suas Opções de privacidade

Utilizamos cookies para melhorar a tua experiência. Podes personalizar as tuas preferências de cookies abaixo. Consulta a nossa {cookiePolicyLink} para obter mais informações.

Definições de cookies

Link, pressione control-option-seta-direita para sair

Centro de Ajuda vazio

Ups! Essa página não existe.

Desapontado(a)

Neutro(a)

Sorriso

A pensar...

A procurar nas fontes...

A analisar...

Os tickets enviados através do messenger ou por um agente de suporte na sua conversa aparecerão aqui.

Nenhum ticket criado por si

Tente utilizar palavras-chave diferentes ou verificar se existem erros de digitação.