Anthropic

Ya sea que estés comenzando el proceso de configurar salvaguardas para tu implementación de API de Claude, o tu implementación ya esté funcionando, aquí tienes algunas estrategias a considerar al construir tu propio programa de seguridad de IA. Estas sugerencias están diseñadas para ayudarte a cumplir con nuestros <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos de Servicio</a> y <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a>, que prohíben ciertos usos de Claude. El incumplimiento de los <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos</a> y la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> puede resultar en la suspensión o terminación de tu acceso a los servicios.

Almacena IDs vinculados con cada llamada de API, para que si necesitas identificar contenido específico que viole las políticas, tengas la capacidad de encontrarlo en tus sistemas.

Considera asignar IDs a los usuarios, lo cual puede ayudarte a rastrear individuos específicos que estén violando la Política de Uso Aceptable de Anthropic, permitiendo acciones más dirigidas en casos de mal uso.

- La decisión de <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">pasar IDs a Anthropic a través de la API</a> depende de ti. Pero, si se proporcionan, podemos identificar violaciones con mayor precisión. Para ayudar a proteger la privacidad de los usuarios finales, cualquier ID que se pase debe estar cifrado criptográficamente.

Considera requerir que los clientes se registren para una cuenta en tu plataforma antes de utilizar Claude

Asegúrate de que tus clientes entiendan los usos permitidos

Advierte, limita o suspende a usuarios que violen repetidamente los <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos de Servicio</a> y la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> de Anthropic

- Almacena IDs vinculados con cada llamada de API, para que si necesitas identificar contenido específico que viole las políticas, tengas la capacidad de encontrarlo en tus sistemas.
- Considera asignar IDs a los usuarios, lo cual puede ayudarte a rastrear individuos específicos que estén violando la Política de Uso Aceptable de Anthropic, permitiendo acciones más dirigidas en casos de mal uso.
  - La decisión de <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">pasar IDs a Anthropic a través de la API</a> depende de ti. Pero, si se proporcionan, podemos identificar violaciones con mayor precisión. Para ayudar a proteger la privacidad de los usuarios finales, cualquier ID que se pase debe estar cifrado criptográficamente.
- Considera requerir que los clientes se registren para una cuenta en tu plataforma antes de utilizar Claude
- Asegúrate de que tus clientes entiendan los usos permitidos
- Advierte, limita o suspende a usuarios que violen repetidamente los <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos de Servicio</a> y la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> de Anthropic

Crea marcos de personalización que restrinjan las interacciones de los usuarios finales con Claude a un conjunto limitado de prompts o que solo permitan a Claude revisar un corpus de conocimiento específico que ya tengas, lo cual disminuirá la capacidad de los usuarios de participar en comportamientos que violen las políticas.

Habilita filtros de seguridad adicionales - herramientas gratuitas de moderación en tiempo real construidas por Anthropic para ayudar a detectar prompts potencialmente dañinos y gestionar acciones en tiempo real para reducir el daño

- Para más información sobre cómo habilitar nuestros filtros de seguridad adicionales, por favor contacta a <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.

- Activa tu bucket privado de S3 para almacenar prompts y completaciones para tu propia evaluación

- Crea marcos de personalización que restrinjan las interacciones de los usuarios finales con Claude a un conjunto limitado de prompts o que solo permitan a Claude revisar un corpus de conocimiento específico que ya tengas, lo cual disminuirá la capacidad de los usuarios de participar en comportamientos que violen las políticas.
- Habilita filtros de seguridad adicionales - herramientas gratuitas de moderación en tiempo real construidas por Anthropic para ayudar a detectar prompts potencialmente dañinos y gestionar acciones en tiempo real para reducir el daño
  - Para más información sobre cómo habilitar nuestros filtros de seguridad adicionales, por favor contacta a <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
- <i>Para Clientes de Bedrock:</i>
  - Activa tu bucket privado de S3 para almacenar prompts y completaciones para tu propia evaluación

<a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Usa Claude para tu moderación de contenido</a>

Ejecuta una API de moderación contra todos los prompts de usuarios finales antes de que sean enviados a Claude para asegurar que no sean dañinos

- <a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Usa Claude para tu moderación de contenido</a>
- Ejecuta una API de moderación contra todos los prompts de usuarios finales antes de que sean enviados a Claude para asegurar que no sean dañinos

Configura un sistema interno de revisión humana para marcar prompts que sean señalados por Claude (siendo usado para moderación de contenido) o una API de moderación como dañinos, para que puedas intervenir y restringir o remover usuarios con altas tasas de violación.

- Configura un sistema interno de revisión humana para marcar prompts que sean señalados por Claude (siendo usado para moderación de contenido) o una API de moderación como dañinos, para que puedas intervenir y restringir o remover usuarios con altas tasas de violación.

Herramientas de Salvaguardas de API

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Encuentra respuestas y obtén ayuda del servicio de Atención al cliente y de expertos de la comunidad de Intercom

Este sitio emplea cookies y otras tecnologías que nosotros y nuestros proveedores externos utilizamos para monitorizar y registrar datos personales sobre ti y tus interacciones con el sitio (por ejemplo, contenidos vistos, movimientos del cursor, grabaciones de pantalla y contenidos del chat) para los fines descritos en nuestra Política de cookies. Al continuar en nuestro sitio, aceptas nuestros {websiteTermsLink}, {privacyPolicyLink} y {cookiePolicyLink}.

Este sitio utiliza cookies y tecnologías similares (“cookies”) que son estrictamente necesarias para su funcionamiento. Nosotros y nuestros socios también desearíamos instalar cookies adicionales para activar las funciones de análisis del rendimiento del sitio, funcionalidad, publicidad y redes sociales. Consulta nuestra {cookiePolicyLink} para más detalles. Puedes cambiar tus preferencias de cookies en nuestra Configuración de cookies.

Usamos cookies para el correcto funcionamiento de nuestro sitio y también con fines analíticos y publicitarios. Puedes activar o desactivar las cookies opcionales como prefieras. Consulta nuestra {cookiePolicyLink} para más información.

Tienes derecho a oponerte a la venta de tus datos personales. Consulta nuestra {cookiePolicyLink} para obtener más detalles sobre el uso que hacemos de tus datos.

Sus opciones de privacidad

Utilizamos cookies para mejorar tu experiencia. A continuación puedes personalizar tus preferencias o consultar nuestra {cookiePolicyLink} para más detalles.

Configuración de cookies

Enlace, Pulse control-opción-flecha derecha para salir

Centro de ayuda vacío

Oh, oh. Esa página no existe.

Decepcionado/a

Imparcial

Sonriente

Pensando...

Buscando en las fuentes...

Analizando...

Los tickets enviados por Messenger o por un agente de atención al cliente con el que mantengas una conversación aparecerán aquí.

No hay tickets creados por ti

Prueba a usar diferentes palabras clave o comprobar si hay errores tipográficos.

Prueba a usar diferentes palabras clave o filtros.

No se ha encontrado ningún ticket

Título

Haz un seguimiento del progreso de todos los tickets relacionados con tu empresa.