Anthropic

Che tu stia iniziando il processo di configurazione della Trust &amp; Safety per la tua implementazione API di Claude, o che la tua implementazione sia già in funzione, ecco alcune strategie da considerare quando costruisci il tuo programma di sicurezza per l'IA. Questi suggerimenti sono progettati per aiutarti a rispettare i nostri <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Termini di Servizio</a> e la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Politica d'Uso</a>, che proibiscono certi utilizzi di Claude. Il mancato rispetto dei <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Termini</a> e della <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Politica d'Uso</a> può comportare la sospensione o la cessazione del tuo accesso ai servizi.

Memorizza gli ID collegati a ogni chiamata API, in modo da poter individuare contenuti specifici che violano le regole nei tuoi sistemi, se necessario.

Considera l'assegnazione di ID agli utenti, che può aiutarti a tracciare specifici individui che violano la Politica d'Uso di Anthropic, permettendo azioni più mirate in casi di uso improprio.

- La scelta di <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">passare gli ID ad Anthropic attraverso l'API</a> spetta a te. Ma, se forniti, possiamo individuare le violazioni con maggiore precisione. Per aiutare a proteggere la privacy degli utenti finali, qualsiasi ID passato dovrebbe essere crittografato con hash.

Considera di richiedere ai clienti di registrare un account sulla tua piattaforma prima di utilizzare Claude

Assicurati che i tuoi clienti comprendano gli usi consentiti

Avvisa, limita o sospendi gli utenti che violano ripetutamente i <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Termini di Servizio</a> e la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Politica d'Uso</a> di Anthropic

- Memorizza gli ID collegati a ogni chiamata API, in modo da poter individuare contenuti specifici che violano le regole nei tuoi sistemi, se necessario.
- Considera l'assegnazione di ID agli utenti, che può aiutarti a tracciare specifici individui che violano la Politica d'Uso di Anthropic, permettendo azioni più mirate in casi di uso improprio.
  - La scelta di <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">passare gli ID ad Anthropic attraverso l'API</a> spetta a te. Ma, se forniti, possiamo individuare le violazioni con maggiore precisione. Per aiutare a proteggere la privacy degli utenti finali, qualsiasi ID passato dovrebbe essere crittografato con hash.
- Considera di richiedere ai clienti di registrare un account sulla tua piattaforma prima di utilizzare Claude
- Assicurati che i tuoi clienti comprendano gli usi consentiti
- Avvisa, limita o sospendi gli utenti che violano ripetutamente i <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Termini di Servizio</a> e la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Politica d'Uso</a> di Anthropic

Crea framework di personalizzazione che limitino le interazioni degli utenti finali con Claude a un set limitato di prompt o permettano a Claude di esaminare solo un corpus di conoscenze specifico che hai già, il che diminuirà la capacità degli utenti di impegnarsi in comportamenti che violano le regole.

Abilita filtri di sicurezza aggiuntivi - strumenti di moderazione in tempo reale gratuiti creati da Anthropic per aiutare a rilevare prompt potenzialmente dannosi e gestire azioni in tempo reale per ridurre i danni

- Per maggiori informazioni su come abilitare i nostri filtri di sicurezza aggiuntivi, contatta <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.

- Attiva il tuo bucket S3 privato per memorizzare prompt e completamenti per la tua valutazione

- Crea framework di personalizzazione che limitino le interazioni degli utenti finali con Claude a un set limitato di prompt o permettano a Claude di esaminare solo un corpus di conoscenze specifico che hai già, il che diminuirà la capacità degli utenti di impegnarsi in comportamenti che violano le regole.
- Abilita filtri di sicurezza aggiuntivi - strumenti di moderazione in tempo reale gratuiti creati da Anthropic per aiutare a rilevare prompt potenzialmente dannosi e gestire azioni in tempo reale per ridurre i danni
  - Per maggiori informazioni su come abilitare i nostri filtri di sicurezza aggiuntivi, contatta <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
- <i>Per i Clienti Bedrock:</i>
  - Attiva il tuo bucket S3 privato per memorizzare prompt e completamenti per la tua valutazione

<a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Usa Claude per la moderazione dei contenuti</a>

Esegui un'API di moderazione su tutti i prompt degli utenti finali prima che vengano inviati a Claude per assicurarti che non siano dannosi

- <a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Usa Claude per la moderazione dei contenuti</a>
- Esegui un'API di moderazione su tutti i prompt degli utenti finali prima che vengano inviati a Claude per assicurarti che non siano dannosi

Configura un sistema di revisione umana interno per segnalare i prompt che sono marcati da Claude (utilizzato per la moderazione dei contenuti) o da un'API di moderazione come dannosi, in modo da poter intervenire per limitare o rimuovere gli utenti con alti tassi di violazione.

- Configura un sistema di revisione umana interno per segnalare i prompt che sono marcati da Claude (utilizzato per la moderazione dei contenuti) o da un'API di moderazione come dannosi, in modo da poter intervenire per limitare o rimuovere gli utenti con alti tassi di violazione.

Strumenti di fiducia e sicurezza per le API

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Trova le risposte e ottieni aiuto dall'assistenza Intercom e dagli esperti della community