Anthropic

Ya sea que recién esté comenzando el proceso de configurar Trust &amp; Safety para su implementación de API de Claude, o su implementación ya esté ejecutándose, aquí hay algunas estrategias a considerar cuando construya su propio programa de seguridad de IA.

Almacene los ID vinculados con cada llamada API, para que si necesita identificar contenido violatorio específico, tenga la capacidad de encontrarlo en sus sistemas.

Considere asignar IDs a los usuarios, lo que puede ayudarlo a rastrear a personas específicas que están violando el AUP de Anthropic, lo que permite una acción más dirigida en casos de mal uso.

- La elección de <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">pasar IDs a Anthropic a través de la API</a> depende de usted. Pero, si se proporcionan, podemos identificar violaciones con más precisión. Para ayudar a proteger la privacidad de los usuarios finales, cualquier ID pasado debe hash criptográfico.

Considere requerir que el cliente se registre para una cuenta en su plataforma antes de utilizar Claude.

Asegúrese de que sus clientes comprendan los usos permitidos.

- Almacene los ID vinculados con cada llamada API, para que si necesita identificar contenido violatorio específico, tenga la capacidad de encontrarlo en sus sistemas.
- Considere asignar IDs a los usuarios, lo que puede ayudarlo a rastrear a personas específicas que están violando el AUP de Anthropic, lo que permite una acción más dirigida en casos de mal uso.
   
  - La elección de <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">pasar IDs a Anthropic a través de la API</a> depende de usted. Pero, si se proporcionan, podemos identificar violaciones con más precisión. Para ayudar a proteger la privacidad de los usuarios finales, cualquier ID pasado debe hash criptográfico.
- Considere requerir que el cliente se registre para una cuenta en su plataforma antes de utilizar Claude.
- Asegúrese de que sus clientes comprendan los usos permitidos.

Cree marcos de personalización que restrinjan las interacciones de los usuarios finales con Claude a un conjunto limitado de indicaciones o solo permitan que Claude revise un corpus de conocimiento específico que ya tiene, lo que disminuirá la capacidad de los usuarios para participar en comportamientos violatorios.

Habilite filtros de seguridad adicionales: herramientas de moderación en tiempo real gratuitas construidas por Anthropic para ayudar a detectar indicaciones potencialmente dañinas y administrar acciones en tiempo real para reducir el daño.

- Para obtener más información sobre cómo habilitar nuestros filtros de seguridad adicionales, comuníquese con <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.

- Active su bucket S3 privado para almacenar indicaciones y finalizaciones para su propia evaluación.

- Cree marcos de personalización que restrinjan las interacciones de los usuarios finales con Claude a un conjunto limitado de indicaciones o solo permitan que Claude revise un corpus de conocimiento específico que ya tiene, lo que disminuirá la capacidad de los usuarios para participar en comportamientos violatorios.
- Habilite filtros de seguridad adicionales: herramientas de moderación en tiempo real gratuitas construidas por Anthropic para ayudar a detectar indicaciones potencialmente dañinas y administrar acciones en tiempo real para reducir el daño.
   
  - Para obtener más información sobre cómo habilitar nuestros filtros de seguridad adicionales, comuníquese con <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
- <i>Para clientes de Bedrock:</i>
   
  - Active su bucket S3 privado para almacenar indicaciones y finalizaciones para su propia evaluación.

<a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Use Claude para su moderación de contenido</a>.

Ejecute una API de moderación contra todas las indicaciones de usuario final antes de enviarlas a Claude para garantizar que no sean dañinas.

- <a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Use Claude para su moderación de contenido</a>.
- Ejecute una API de moderación contra todas las indicaciones de usuario final antes de enviarlas a Claude para garantizar que no sean dañinas.

Configure un sistema de revisión humana interna para marcar indicaciones que Claude (que se utiliza para la moderación de contenido) o una API de moderación marcan como dañinas, para que pueda intervenir para restringir o eliminar usuarios con tasas de violación altas.

- Configure un sistema de revisión humana interna para marcar indicaciones que Claude (que se utiliza para la moderación de contenido) o una API de moderación marcan como dañinas, para que pueda intervenir para restringir o eliminar usuarios con tasas de violación altas.

Herramientas de confianza y seguridad de API

Terms of Service

Product

Privacy Policy

Research

Acceptable Use Policy

Company

Responsible Disclosure Policy

News

Compliance

Careers

Encuentra respuestas y obtén ayuda del servicio de Atención al cliente y de expertos de la comunidad de Intercom

Centro de ayuda vacío

Oh, oh. Esa página no existe.

Decepcionado/a

Imparcial

Sonriente

Título

Haz un seguimiento del progreso de todos los tickets relacionados con tu empresa.