Anthropic

Ya sea que esté comenzando el proceso de configurar Trust &amp; Safety para su implementación de API de Claude, o que su implementación ya esté en funcionamiento, aquí hay algunas estrategias a considerar al construir su propio programa de seguridad de IA. Estas sugerencias están diseñadas para ayudarlo a cumplir con nuestros <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos de Servicio</a> y <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a>, que prohíben ciertos usos de Claude. El incumplimiento de los <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos</a> y la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> puede resultar en la suspensión o terminación de su acceso a los servicios.

Almacene IDs vinculados a cada llamada de API, para que si necesita identificar contenido específico que viole las normas, tenga la capacidad de encontrarlo en sus sistemas.

Considere asignar IDs a los usuarios, lo que puede ayudarlo a rastrear individuos específicos que estén violando la Política de Uso Aceptable de Anthropic, permitiendo una acción más dirigida en casos de mal uso.

-  
  La decisión de <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">pasar IDs a Anthropic a través de la API</a> depende de usted. Pero, si se proporcionan, podemos identificar las violaciones con mayor precisión. Para ayudar a proteger la privacidad de los usuarios finales, cualquier ID que se pase debe estar cifrado criptográficamente.
   

Considere requerir que el cliente se registre para una cuenta en su plataforma antes de utilizar Claude

Asegúrese de que sus clientes entiendan los usos permitidos

Advierta, limite o suspenda a los usuarios que violen repetidamente los <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos de Servicio</a> y la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> de Anthropic

-  
  Almacene IDs vinculados a cada llamada de API, para que si necesita identificar contenido específico que viole las normas, tenga la capacidad de encontrarlo en sus sistemas.
   
-  
  Considere asignar IDs a los usuarios, lo que puede ayudarlo a rastrear individuos específicos que estén violando la Política de Uso Aceptable de Anthropic, permitiendo una acción más dirigida en casos de mal uso.
   
  -  
    La decisión de <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">pasar IDs a Anthropic a través de la API</a> depende de usted. Pero, si se proporcionan, podemos identificar las violaciones con mayor precisión. Para ayudar a proteger la privacidad de los usuarios finales, cualquier ID que se pase debe estar cifrado criptográficamente.
     
   
-  
  Considere requerir que el cliente se registre para una cuenta en su plataforma antes de utilizar Claude
   
-  
  Asegúrese de que sus clientes entiendan los usos permitidos
   
-  
  Advierta, limite o suspenda a los usuarios que violen repetidamente los <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos de Servicio</a> y la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> de Anthropic
   

Cree marcos de personalización que restrinjan las interacciones del usuario final con Claude a un conjunto limitado de indicaciones o solo permitan que Claude revise un corpus de conocimiento específico que ya tiene, lo que disminuirá la capacidad de los usuarios de participar en comportamientos que violen las normas.

Habilite filtros de seguridad adicionales - herramientas de moderación en tiempo real gratuitas creadas por Anthropic para ayudar a detectar indicaciones potencialmente dañinas y gestionar acciones en tiempo real para reducir el daño

-  
  Para obtener más información sobre cómo habilitar nuestros filtros de seguridad adicionales, comuníquese con <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
   

-  
  Active su bucket S3 privado para almacenar indicaciones y completaciones para su propia evaluación
   

-  
  Cree marcos de personalización que restrinjan las interacciones del usuario final con Claude a un conjunto limitado de indicaciones o solo permitan que Claude revise un corpus de conocimiento específico que ya tiene, lo que disminuirá la capacidad de los usuarios de participar en comportamientos que violen las normas.
   
-  
  Habilite filtros de seguridad adicionales - herramientas de moderación en tiempo real gratuitas creadas por Anthropic para ayudar a detectar indicaciones potencialmente dañinas y gestionar acciones en tiempo real para reducir el daño
   
  -  
    Para obtener más información sobre cómo habilitar nuestros filtros de seguridad adicionales, comuníquese con <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
     
   
-  
  <i>Para Clientes de Bedrock:</i>
   
  -  
    Active su bucket S3 privado para almacenar indicaciones y completaciones para su propia evaluación
     
   

<a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Use Claude para su moderación de contenido</a>

Ejecute una API de moderación contra todas las indicaciones del usuario final antes de que se envíen a Claude para asegurarse de que no sean dañinas

-  
  <a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Use Claude para su moderación de contenido</a>
   
-  
  Ejecute una API de moderación contra todas las indicaciones del usuario final antes de que se envíen a Claude para asegurarse de que no sean dañinas
   

Configure un sistema de revisión humana interno para marcar las indicaciones que Claude (siendo utilizado para moderación de contenido) o una API de moderación señalen como dañinas, de modo que pueda intervenir para restringir o eliminar usuarios con altas tasas de violación.

-  
  Configure un sistema de revisión humana interno para marcar las indicaciones que Claude (siendo utilizado para moderación de contenido) o una API de moderación señalen como dañinas, de modo que pueda intervenir para restringir o eliminar usuarios con altas tasas de violación.
   

Herramientas de Confianza y Seguridad para API

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Encuentra respuestas y obtén ayuda del servicio de Atención al cliente y de expertos de la comunidad de Intercom

Enlace, Pulse control-opción-flecha derecha para salir

Centro de ayuda vacío

Oh, oh. Esa página no existe.

Decepcionado/a

Imparcial

Sonriente

Pensando...

Buscando en las fuentes...

Analizando...

Título

Haz un seguimiento del progreso de todos los tickets relacionados con tu empresa.