Anthropic

Che tu stia solo iniziando il processo di impostazione di Trust &amp; Safety per la tua distribuzione API di Claude, o la tua distribuzione sia già in esecuzione, ecco alcune strategie da considerare quando si costruisce il proprio programma di sicurezza AI.

Archivia gli ID collegati a ciascuna chiamata API, in modo da poter individuare contenuti violativi specifici nei tuoi sistemi se necessario.

Prendi in considerazione l'assegnazione di ID agli utenti, che può aiutarti a tenere traccia di singoli individui che violano l'AUP di Anthropic, consentendo azioni più mirate in ​​caso di abuso.

- La scelta di <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">passare gli ID ad Anthropic tramite l'API</a> dipende da te. Ma, se forniti, possiamo individuare le violazioni con maggiore precisione. Per contribuire a proteggere la privacy degli utenti finali, eventuali ID passati dovrebbero essere crittografati con hash.

Prendi in considerazione la possibilità di richiedere al cliente di registrarsi per un account sulla tua piattaforma prima di utilizzare Claude

Assicurati che i tuoi clienti comprendano gli usi consentiti

- Archivia gli ID collegati a ciascuna chiamata API, in modo da poter individuare contenuti violativi specifici nei tuoi sistemi se necessario.
- Prendi in considerazione l'assegnazione di ID agli utenti, che può aiutarti a tenere traccia di singoli individui che violano l'AUP di Anthropic, consentendo azioni più mirate in ​​caso di abuso.
   
  - La scelta di <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">passare gli ID ad Anthropic tramite l'API</a> dipende da te. Ma, se forniti, possiamo individuare le violazioni con maggiore precisione. Per contribuire a proteggere la privacy degli utenti finali, eventuali ID passati dovrebbero essere crittografati con hash.
- Prendi in considerazione la possibilità di richiedere al cliente di registrarsi per un account sulla tua piattaforma prima di utilizzare Claude
- Assicurati che i tuoi clienti comprendano gli usi consentiti

Crea framework di personalizzazione che limitino le interazioni degli utenti finali con Claude a un set limitato di prompt o consentano solo a Claude di rivedere un corpus di conoscenze specifico che hai già, il che ridurrà la capacità degli utenti di impegnarsi in comportamenti violativi.

Abilita filtri di sicurezza aggiuntivi: strumenti di moderazione in tempo reale gratuiti costruiti da Anthropic per aiutare a rilevare potenziali prompt dannosi e gestire azioni in tempo reale per ridurre i danni

- Per ulteriori informazioni su come abilitare i nostri filtri di sicurezza aggiuntivi, contatta <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.

- Attiva il tuo bucket S3 privato per archiviare prompt e completamenti per la tua valutazione

- Crea framework di personalizzazione che limitino le interazioni degli utenti finali con Claude a un set limitato di prompt o consentano solo a Claude di rivedere un corpus di conoscenze specifico che hai già, il che ridurrà la capacità degli utenti di impegnarsi in comportamenti violativi.
- Abilita filtri di sicurezza aggiuntivi: strumenti di moderazione in tempo reale gratuiti costruiti da Anthropic per aiutare a rilevare potenziali prompt dannosi e gestire azioni in tempo reale per ridurre i danni
   
  - Per ulteriori informazioni su come abilitare i nostri filtri di sicurezza aggiuntivi, contatta <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
- <i>Per i clienti Bedrock:</i>
   
  - Attiva il tuo bucket S3 privato per archiviare prompt e completamenti per la tua valutazione

<a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Usa Claude per la tua moderazione dei contenuti</a>

Esegui un'API di moderazione su tutti i prompt dell'utente finale prima che vengano inviati a Claude per assicurarti che non siano dannosi

- <a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Usa Claude per la tua moderazione dei contenuti</a>
- Esegui un'API di moderazione su tutti i prompt dell'utente finale prima che vengano inviati a Claude per assicurarti che non siano dannosi

Imposta un sistema di revisione umano interno per contrassegnare i prompt che sono contrassegnati da Claude (utilizzato per la moderazione dei contenuti) o da un'API di moderazione come dannosi in modo da poter intervenire per limitare o rimuovere gli utenti con alti tassi di violazione.

- Imposta un sistema di revisione umano interno per contrassegnare i prompt che sono contrassegnati da Claude (utilizzato per la moderazione dei contenuti) o da un'API di moderazione come dannosi in modo da poter intervenire per limitare o rimuovere gli utenti con alti tassi di violazione.

Strumenti di fiducia e sicurezza API

Terms of Service

Product

Privacy Policy

Research

Acceptable Use Policy

Company

Responsible Disclosure Policy

News

Compliance

Careers

Trova le risposte e ottieni aiuto dall'assistenza Intercom e dagli esperti della community